关于数据集

该精炼数据集最初基于 Ahlam Rashid 在 Mendeley Data 上上传的“糖尿病数据集”。原始数据集的链接为:https://data.mendeley.com/datasets/wj9rwkp9c2/1。原始数据集共包含 1000 名受试者,分为三类:糖尿病患者、非糖尿病患者和预测糖尿病患者。

在 1000 名受试者中,844 名患有糖尿病,103 名非糖尿病,53 名预测患有糖尿病,导致类别极度不平衡。我们在原始数据集中发现了总共 174 名重复受试者,随后将其删除。删除重复受试者后,剩余 690 名糖尿病患者、96 名非糖尿病患者和 40 名预测患有糖尿病的受试者。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?