关于数据集
该临床数据集收集自安卡拉 VM 医疗园区医院内科门诊,包含 319 名患者(2022 年 6 月至 2023 年 6 月)的数据,其中 161 名被诊断患有胆结石疾病。它包含 38 个特征,包括人口统计学、生物阻抗和实验室数据,并已获得安卡拉市医院伦理委员会 (E2-23-4632) 的伦理批准。人口统计学变量包括年龄、性别、身高、体重和 BMI。生物阻抗数据包括总水分、细胞外水分和细胞内水分、肌肉和脂肪质量、蛋白质、内脏脂肪面积和肝脏脂肪。实验室特征包括葡萄糖、总胆固醇、高密度脂蛋白 (HDL)、低密度脂蛋白 (LDL)、甘油三酯、天冬氨酸氨基转移酶 (AST)、丙氨酸氨基转移酶 (ALT)、碱性磷酸酶 (ALP)、肌酐、肾小球滤过率 (GFR)、C 反应蛋白 (CRP)、血红蛋白和维生素 D。该数据集完整,无缺失值,且疾病状态均衡,无需进行额外的预处理。它为利用非成像特征进行基于机器学习的胆结石预测提供了坚实的基础。
该数据集包含与胆结石状况和潜在心血管风险因素相关的临床和人口统计信息。
🔸 特点:
胆结石状态(0 = 否,1 = 是):
二进制指标显示患者是否被诊断出患有胆结石。
年龄(岁):
患者的年龄,从年轻人到老年人。
性别(0 = 女性,1 = 男性):
表示患者的生理性别。
合并症(0 = 否,1 = 是):
除胆结石或心脏病外,还存在其他疾病。
冠状动脉疾病 (CAD)(0 = 否,1 = 是):
患者是否被诊断出患有 CAD——心脏病发作的主要原因。
甲状腺功能减退症(0 = 否,1 = 是):
表明患者是否患有甲状腺功能低下。
高脂血症(0 = 否,1 = 是):
血液中存在高浓度的脂质(脂肪),这是心脏病的主要风险因素。
糖尿病 (DM)(0 = 否,1 = 是):
表明患者是否患有糖尿病,这是一种常与心血管问题相关的慢性疾病。
身高(厘米):
患者的身高(厘米)。
体重(公斤):
患者的体重(公斤)。
身体质量指数 (BMI):
根据身高和体重测量身体脂肪,可用于肥胖评估。
总体水量 (TBW):
患者体内所含的水量 – 对水合作用和代谢功能很重要。
细胞外水 (ECW):
位于细胞外部的水,通常在炎症或液体潴留时增加。
细胞内水 (ICW):
位于细胞内部的水 – 用于评估细胞健康状况。
ECF/TBW 比率:
细胞外液与全身水的比率,与识别液体失衡或炎症有关。
总体脂率 (TBFR) (%):
脂肪占体重的百分比——一个关键的肥胖指标。
瘦体重 (LM) (%):
身体由肌肉、骨骼和器官等非脂肪成分组成的百分比。
蛋白质含量(%):
反映体内蛋白质水平,与肌肉质量和整体营养状况相关。
内脏脂肪评级 (VFR):
测量内脏器官周围储存的脂肪的指数——与心脏代谢风险密切相关。
骨量(千克):
估计体内骨骼的质量,与骨骼健康有关。
肌肉质量(公斤):
肌肉的总质量,对体力和代谢健康很重要。
肥胖(%):
基于指数的整体肥胖表示。
总脂肪含量(TFC):
体内脂肪的绝对量,以千克为单位。
内脏脂肪面积 (VFA):
量化腹部脂肪——代谢综合征的主要预测指标。
内脏肌肉面积 (VMA):
腹部肌肉质量,以千克为单位。
肝脏脂肪堆积 (HFA)(0 = 否,1 = 是):
表示肝脏中存在脂肪堆积 – 非酒精性脂肪肝疾病的标志。
葡萄糖(mg/dL):
血糖水平——糖尿病和代谢紊乱时升高。
总胆固醇 (TC):
血液中的总胆固醇水平。
低密度脂蛋白 (LDL):
“坏”胆固醇——较高水平与动脉粥样硬化有关。
高密度脂蛋白(HDL):
“好”胆固醇——预防心脏病。
甘油三酯:
血液中的一种脂肪——代谢综合征患者体内甘油三酯水平升高。
天冬氨酸氨基转移酶 (AST):
肝酶;高水平可能表明肝损伤。
丙氨酸氨基转移酶 (ALT):
另一种肝酶;有助于检测肝脏炎症或损伤。
碱性磷酸酶(ALP):
与肝脏和骨骼疾病有关的酶。
肌酐:
用于评估肾功能的废物。
肾小球滤过率(GFR):
肾功能的关键指标。
C 反应蛋白 (CRP):
与感染、心血管风险和代谢紊乱相关的炎症标志物。
血红蛋白 (HGB):
红细胞中携带氧气的蛋白质——对贫血和氧气运输很重要。
维生素 D:
对骨骼健康、免疫力和各种代谢功能至关重要。
