背景描述

医院再入院预测(synthetic-dataset)
医院再入院预测数据集

数据说明

关于 Dataset
概述
预测哪些患者在出院后 30 天内再入院风险高。这个合成数据集模拟真实世界的模式,以帮助降低医疗保健成本(估计每年可预防的再入院率为 $17B)。

数量: 30,000 条记录
特点: 11 个临床/人口统计变量
目标: (二进制:是/否)readmitted_30_days

文件
hospital_readmissions_30k.csv: 主要数据集
sample_submission.csv: 提交文件示例(用于比赛)

使用案例
构建 ML 模型以标记高危患者
分析危险因素(例如糖尿病、出院目的地)
医疗保健运营规划


列描述

列名中文说明
patient_id​患者ID​患者的唯一标识符
age​年龄​患者的年龄
gender​性别​患者的性别
blood_pressure​血压​通常为收缩压/舒张压的测量值
cholesterol​胆固醇水平​血液中的胆固醇含量指标
bmi​身体质量指数​体重(kg)除以身高(m)的平方,衡量肥胖程度的指标
diabetes​是否患有糖尿病​二元指标(是/否),表示患者是否有糖尿病
hypertension​是否患有高血压​二元指标(是/否),表示患者是否有高血压
medication_count​用药数量​患者服用的药物种类数量
length_of_stay​住院天数​本次住院的总天数
discharge_destination​出院去向​患者出院后的去向(如:回家、康复机构、转院等)
readmitted_30_days​30天内是否再入院​​(重要目标变量)​​ 二元指标,表示患者出院后30天内是否再次入院
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?