关于数据集
数据集描述
的学生表现数据集包含1,000名学生的详细信息。它着重于他们的人口背景,父母的教育水平以及在三个标准化测试科目中的表现: 数学,阅读和写作。该数据集广泛用于探索社会经济因素与学业成绩之间的关系,以及用于构建预测模型以了解影响学生成绩的因素。
共有8列,涵盖分类变量和数值变量。分类特征包括性别,种族/民族,父母的教育水平,午餐类型以及学生是否完成了考试准备课程。数字特征包括数学,阅读和写作的分数-每个分数从0到100。
数据集没有缺失值,使其干净并准备好进行分析。它总共由1,000行和8列组成。
平均数学分数约为66,平均阅读分数约为69,平均写作分数约为68。总体而言,学生在阅读和写作方面的表现往往比数学略好。不同人群的分数差异很大,一些学生取得了满分,另一些学生得分很低。
在分类变量中,性别分布几乎是平衡的,女性为518,男性为482。代表的最大种族或族裔群体是C组,其次是B和D组。大多数学生的父母已经完成了 “一些大学” 作为他们的最高教育水平。大多数学生接受标准午餐,大多数学生没有完成考试准备课程。
由于其丰富的人口统计和性能数据组合,该数据集非常适合数据可视化、统计分析和预测建模项目。它通常用于分析性别,父母教育或午餐类型等因素如何与学业成绩相关。
列说明:
| 英文字段名 | 中文翻译 | 说明 |
|---|---|---|
| gender | 性别 | 学生的性别 |
| race/ethnicity | 种族/民族 | 学生的种族或民族背景 |
| parental level of education | 父母教育程度 | 学生父母的教育水平 |
| lunch | 午餐类型 | 学生的午餐福利类型(如标准餐、免费/减免餐) |
| test preparation course | 备考课程 | 是否参加过考试准备课程 |
| math score | 数学成绩 | 数学科目考试分数 |
| reading score | 阅读成绩 | 阅读科目考试分数 |
| writing score | 写作成绩 | 写作科目考试分数 |

资源下载
下载价格9.9 元
VIP免费
立即购买
