关于数据集


🧬 肾脏疾病风险数据集

这个合成但具有医学现实意义的数据集旨在帮助研究人员、数据科学家和医疗保健专业人员探索慢性肾病 (CKD)风险并使用机器学习模型预测透析需求。

它包含1,985 行数据9 个精心设计的临床特征以及 2 个目标列。每个数据点都根据临床指南、肾脏病学研究和疾病进展模式模拟真实患者的病史。

📁 列说明

列名类型描述
Age数字患者年龄。年龄越大,CKD 风险越高。
Creatinine_Level数字血肌酐水平(mg/dL),是肾功能的关键指标。
BUN数字血尿素氮水平(mg/dL)。血尿素氮升高可能提示患有慢性肾脏病 (CKD)。
Diabetes分类如果患者患有糖尿病,则为 1,否则为 0。糖尿病是 CKD 的主要风险因素。
Hypertension分类如果患者患有高血压,则为 1,否则为 0。通常与肾脏问题有关。
GFR数字肾小球滤过率(ml/min/1.73m²),肾功能的最佳衡量指标。
Urine_Output数字尿液产生量(毫升/天)。尿量低可能提示肾功能障碍。
CKD_Status目标 (0/1)如果患者患有慢性肾病则为 1,否则为 0。

Dialysis_Needed | 目标(0/1)| 如果患者病情进展需要透析,则为 1,否则为 0。|

🎯 用例

  • 探索性数据分析 (EDA):可视化年龄、GFR、肌酐、尿量和风险因素的分布。
  • 二元分类:建立模型来预测CKD_StatusDialysis_Needed
  • 医学机器学习研究:为医疗保健专业人士创建可解释的模型(例如 SHAP、LIME)。
  • 模型部署:练习部署真实世界的医疗模型(例如,使用 Streamlit 或 Flask)。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?