完整的药物数据库:制造商、剂量、禁忌症和警告

关于数据集

药品标签和副作用数据集

数据集概述

这个全面的药物合成数据集包含1,393 条合成药物信息记录,共15 列,专为专注于医疗保健分析、药物安全分析和药物研究的数据科学项目而设计。该数据集模拟了现实世界中的药物数据,具有适当的多样性和切合实际的约束条件,适用于机器学习应用。

数据集规范

属性价值
总记录数1,393
总列数15
文件格式CSV
数据类型混合(用于数据清理实践)
领域制药/医疗保健
用例机器学习训练、数据分析、医疗保健研究

色谱柱规格

分类特征

列名数据类型唯一值描述示例值
drug_name目的1,283 个独特具有现实命名模式的药品名称“洛西泮32”、“阿莫肝素43”、“维拉西泮10”
manufacturer目的10个独特大型制药公司辉瑞公司、阿斯利康、强生公司
drug_class目的10个独特治疗药物分类抗生素、镇痛药、抗抑郁药、疫苗
indications目的10个独特该药物治疗的疾病“缓解疼痛”、“细菌感染”、“抑郁症治疗”
side_effects目的434个独特副作用组合(每种药物 1-3 种)“恶心、头晕”、“头痛、疲劳、皮疹”
administration_route目的7 独特药物输送方法口服、静脉注射、外用、吸入、舌下
contraindications目的10个独特药物使用的医学警告“怀孕”、“心脏病”、“肝病”
warnings目的10个独特安全说明和注意事项“与食物一起服用”、“避免饮酒”、“监测血压”
batch_number目的1,393 个独特生产批次标识符“xr691zv”,“Ye266vU”,“Rm082yX”
expiry_date目的782 个独特药品有效期(YYYY-MM-DD)“2025-12-13”、“2027-03-09”、“2026-10-06”
side_effect_severity目的3 独特严重程度分类轻度、中度、重度
approval_status目的3 独特监管审批状态已批准、待处理、已拒绝

数值特征

列名数据类型范围意思是标准差描述
approval_year浮点数/字符串*1990-20242006年7月10.0FDA/监管机构批准年份
dosage_mg浮点数/字符串*10-990毫克499.7290.0药物强度(毫克)
price_usd浮点数/字符串*2.32美元至499.24美元251.12美元144.81 美元药品价格(美元)

*为了进行数据清理,特意存储为混合类型

关键统计数据

制造商分布

制造商数数百分比
辉瑞公司17012.2%
阿斯利康~140~10.0%
默克公司~140~10.0%
强生公司~140~10.0%
葛兰素史克~140~10.0%
其他的~623~44.8%

药物类别分布

药物类别数数最常见
消炎(药154
抗生素~140
抗抑郁药~140
抗病毒物质~140
疫苗~140
其他的~679

副作用严重程度

严重程度数数百分比
严重48835.0%
缓和~453~32.5%
温和的~452~32.5%

潜在用例

1.机器学习应用

  • 药物批准预测:根据药物特性预测批准可能性
  • 价格预测:使用类别、制造商、剂量等特征估算药品价格
  • 副作用分类:根据药物特性对严重程度进行分类
  • 市场成功分析:分析影响药品市场表现的因素

2. 数据工程项目

  • ETL 管道开发:实践数据清理和转换
  • 数据质量评估:实施数据验证和质量检查
  • 数据库设计:创建规范化的制药数据库模式
  • 实时处理:药物监测系统的流处理

3.商业智能

  • 医药市场分析:制造商市场份额和竞争分析
  • 药物安全分析:副作用模式和安全性分析
  • 监管合规性:审批趋势和监管时间表分析
  • 定价策略:跨药品类别的竞争性定价分析
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?