关于数据集
🧬 肾脏疾病风险数据集
这个合成但具有医学现实意义的数据集旨在帮助研究人员、数据科学家和医疗保健专业人员探索慢性肾病 (CKD)风险并使用机器学习模型预测透析需求。
它包含1,985 行数据、9 个精心设计的临床特征以及 2 个目标列。每个数据点都根据临床指南、肾脏病学研究和疾病进展模式模拟真实患者的病史。
📁 列说明
列名 | 类型 | 描述 |
---|---|---|
Age | 数字 | 患者年龄。年龄越大,CKD 风险越高。 |
Creatinine_Level | 数字 | 血肌酐水平(mg/dL),是肾功能的关键指标。 |
BUN | 数字 | 血尿素氮水平(mg/dL)。血尿素氮升高可能提示患有慢性肾脏病 (CKD)。 |
Diabetes | 分类 | 如果患者患有糖尿病,则为 1,否则为 0。糖尿病是 CKD 的主要风险因素。 |
Hypertension | 分类 | 如果患者患有高血压,则为 1,否则为 0。通常与肾脏问题有关。 |
GFR | 数字 | 肾小球滤过率(ml/min/1.73m²),肾功能的最佳衡量指标。 |
Urine_Output | 数字 | 尿液产生量(毫升/天)。尿量低可能提示肾功能障碍。 |
CKD_Status | 目标 (0/1) | 如果患者患有慢性肾病则为 1,否则为 0。 |
| Dialysis_Needed
| 目标(0/1)| 如果患者病情进展需要透析,则为 1,否则为 0。|
🎯 用例
- 探索性数据分析 (EDA):可视化年龄、GFR、肌酐、尿量和风险因素的分布。
- 二元分类:建立模型来预测
CKD_Status
或Dialysis_Needed
。 - 医学机器学习研究:为医疗保健专业人士创建可解释的模型(例如 SHAP、LIME)。
- 模型部署:练习部署真实世界的医疗模型(例如,使用 Streamlit 或 Flask)。

资源下载
下载价格9.9 元
VIP免费
立即购买