关于数据集

数据集描述

学生表现数据集包含1,000名学生的详细信息。它着重于他们的人口背景,父母的教育水平以及在三个标准化测试科目中的表现: 数学,阅读和写作。该数据集广泛用于探索社会经济因素与学业成绩之间的关系,以及用于构建预测模型以了解影响学生成绩的因素。

共有8列,涵盖分类变量和数值变量。分类特征包括性别,种族/民族,父母的教育水平,午餐类型以及学生是否完成了考试准备课程。数字特征包括数学,阅读和写作的分数-每个分数从0到100。

数据集没有缺失值,使其干净并准备好进行分析。它总共由1,000行和8列组成。

平均数学分数约为66,平均阅读分数约为69,平均写作分数约为68。总体而言,学生在阅读和写作方面的表现往往比数学略好。不同人群的分数差异很大,一些学生取得了满分,另一些学生得分很低。

在分类变量中,性别分布几乎是平衡的,女性为518,男性为482。代表的最大种族或族裔群体是C组,其次是B和D组。大多数学生的父母已经完成了 “一些大学” 作为他们的最高教育水平。大多数学生接受标准午餐,大多数学生没有完成考试准备课程。

由于其丰富的人口统计和性能数据组合,该数据集非常适合数据可视化、统计分析和预测建模项目。它通常用于分析性别,父母教育或午餐类型等因素如何与学业成绩相关。

列说明:

英文字段名中文翻译说明
gender性别学生的性别
race/ethnicity种族/民族学生的种族或民族背景
parental level of education父母教育程度学生父母的教育水平
lunch午餐类型学生的午餐福利类型(如标准餐、免费/减免餐)
test preparation course备考课程是否参加过考试准备课程
math score数学成绩数学科目考试分数
reading score阅读成绩阅读科目考试分数
writing score写作成绩写作科目考试分数

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?