关于数据集
该数据集包含 200 名学生的信息及其基于各种学习相关因素的学业成绩。它是一个专为教育分析、机器学习和数据科学实践而设计的合成数据集。
该数据集探讨了学习习惯、睡眠模式、出勤率和过去的学业成绩如何影响学生的期末考试成绩。
它对于以下任务很有用:
- 回归(预测考试成绩)
- 分类(例如,通过/失败预测)
- 相关性分析(学习时间与成绩之间的关系
- 数据可视化和特征重要性分析
📊 列(数据字典)
- student_id → 每个学生的唯一 ID
- hours_studied → 每天学习的小时数(1-12 小时)
- sleep_hours → 平均每天睡眠时间(4-9 小时)
- attendance_percent → 课堂出勤率 (50–100%)
- previous_scores → 先前平均学业成绩(40-95 分)
- exam_score → 期末考试成绩(0-100 分,来自其他因素 + 随机性)
💡 潜在用例
- 建立回归模型来预测学生的表现。
- 确定哪些因素(学习时间、睡眠、出勤率)对考试结果影响最大。
- 教育研究和对学生学习行为的见解。
- 为初学者演示机器学习算法。

资源下载
下载价格9.9 元
VIP免费
立即购买