背景描述
医院再入院预测(synthetic-dataset)
医院再入院预测数据集
数据说明
关于 Dataset
概述
预测哪些患者在出院后 30 天内再入院风险高。这个合成数据集模拟真实世界的模式,以帮助降低医疗保健成本(估计每年可预防的再入院率为 $17B)。
数量: 30,000 条记录
特点: 11 个临床/人口统计变量
目标: (二进制:是/否)readmitted_30_days
文件
hospital_readmissions_30k.csv: 主要数据集
sample_submission.csv: 提交文件示例(用于比赛)
使用案例
构建 ML 模型以标记高危患者
分析危险因素(例如糖尿病、出院目的地)
医疗保健运营规划
列描述
| 列名 | 中文 | 说明 |
|---|---|---|
patient_id | 患者ID | 患者的唯一标识符 |
age | 年龄 | 患者的年龄 |
gender | 性别 | 患者的性别 |
blood_pressure | 血压 | 通常为收缩压/舒张压的测量值 |
cholesterol | 胆固醇水平 | 血液中的胆固醇含量指标 |
bmi | 身体质量指数 | 体重(kg)除以身高(m)的平方,衡量肥胖程度的指标 |
diabetes | 是否患有糖尿病 | 二元指标(是/否),表示患者是否有糖尿病 |
hypertension | 是否患有高血压 | 二元指标(是/否),表示患者是否有高血压 |
medication_count | 用药数量 | 患者服用的药物种类数量 |
length_of_stay | 住院天数 | 本次住院的总天数 |
discharge_destination | 出院去向 | 患者出院后的去向(如:回家、康复机构、转院等) |
readmitted_30_days | 30天内是否再入院 | (重要目标变量) 二元指标,表示患者出院后30天内是否再次入院 |

资源下载
下载价格9.9 元
VIP免费
立即购买
