面向机器学习初学者的葡萄酒品质分析。遵循标准机器学习流程方法。
摘要:本文包含两组数据集,分别涉及葡萄牙北部的红、白绿酒样本。目标是基于物理化学测试建立葡萄酒质量模型。
数据集信息:
这两个数据集分别与葡萄牙“Vinho Verde”葡萄酒的红葡萄酒和白葡萄酒相关。由于隐私和物流问题,仅提供物理化学(输入)和感官(输出)变量(例如,没有关于葡萄种类、葡萄酒品牌、葡萄酒售价等的数据)。
这些数据集可以视为分类或回归任务。类别是有序的,且不平衡(例如,正常的葡萄酒数量远多于优质或劣质的葡萄酒)。可以使用异常值检测算法来检测少数优质或劣质的葡萄酒。此外,我们不确定所有输入变量是否都相关。因此,测试特征选择方法可能会很有趣。
属性信息:
输入变量(基于物理化学测试):
- 固定酸度
- 挥发性酸度
- 柠檬酸
- 残糖
- 氯化物
- 游离二氧化硫
- 总二氧化硫
- 密度
- pH
- 硫酸盐
- 酒精
输出变量(基于感官数据):
- 质量(分数在 0 到 10 之间)
这些列已在 Kaggle 数据资源管理器中描述。

资源下载
下载价格9.9 元
VIP免费
立即购买