面向机器学习初学者的葡萄酒品质分析。遵循标准机器学习流程方法。

摘要:本文包含两组数据集,分别涉及葡萄牙北部的红、白绿酒样本。目标是基于物理化学测试建立葡萄酒质量模型。

数据集信息:

这两个数据集分别与葡萄牙“Vinho Verde”葡萄酒的红葡萄酒和白葡萄酒相关。由于隐私和物流问题,仅提供物理化学(输入)和感官(输出)变量(例如,没有关于葡萄种类、葡萄酒品牌、葡萄酒售价等的数据)。

这些数据集可以视为分类或回归任务。类别是有序的,且不平衡(例如,正常的葡萄酒数量远多于优质或劣质的葡萄酒)。可以使用异常值检测算法来检测少数优质或劣质的葡萄酒。此外,我们不确定所有输入变量是否都相关。因此,测试特征选择方法可能会很有趣。

属性信息:

输入变量(基于物理化学测试):

  1. 固定酸度
  2. 挥发性酸度
  3. 柠檬酸
  4. 残糖
  5. 氯化物
  6. 游离二氧化硫
  7. 总二氧化硫
  8. 密度
  9. pH
  10. 硫酸盐
  11. 酒精

输出变量(基于感官数据):

  1. 质量(分数在 0 到 10 之间)

这些列已在 Kaggle 数据资源管理器中描述。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?