关于数据集

该数据集包含 200 名学生的信息及其基于各种学习相关因素的学业成绩。它是一个专为教育分析、机器学习和数据科学实践而设计的合成数据集。

该数据集探讨了学习习惯、睡眠模式、出勤率和过去的学业成绩如何影响学生的期末考试成绩。

它对于以下任务很有用:

  • 回归(预测考试成绩)
  • 分类(例如,通过/失败预测)
  • 相关性分析(学习时间与成绩之间的关系
  • 数据可视化和特征重要性分析

📊 列(数据字典)

  • student_id → 每个学生的唯一 ID
  • hours_studied → 每天学习的小时数(1-12 小时)
  • sleep_hours → 平均每天睡眠时间(4-9 小时)
  • attendance_percent → 课堂出勤率 (50–100%)
  • previous_scores → 先前平均学业成绩(40-95 分)
  • exam_score → 期末考试成绩(0-100 分,来自其他因素 + 随机性)

💡 潜在用例

  • 建立回归模型来预测学生的表现。
  • 确定哪些因素(学习时间、睡眠、出勤率)对考试结果影响最大。
  • 教育研究和对学生学习行为的见解。
  • 为初学者演示机器学习算法。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?