关于数据集

该数据集包含10,000个综合生成的记录,模拟从印度大学毕业的学生的学术和职业成果,主要关注工程和管理流。

此合成数据集的主要目标是为以下内容提供丰富的非敏感资源:

预测建模:训练机器学习模型以预测工作安置成功 (分类) 和最终CTC/薪水 (回归)。
偏差分析:在受控的模拟环境中探索分类变量 (如性别或大学级别) 对安置和工资结果的影响。
** 探索性数据分析 (EDA): ** 调查学习成绩 (CGPA,项目,实习) 和职业道路 (放置与更高的研究) 之间的相关性。

关于合成的关键注意事项
这些数据是合成的,不包含任何真实的个人身份信息 (PII)。

列说明:

英文字段名中文翻译说明
Student ID学生ID学生的唯一标识符
Name姓名学生姓名
Gender性别学生性别
Year入学年份/年级入学年份或所在年级
Skills技能学生掌握的技能集合
Backlogs未通过科目数挂科或未通过的科目数量
Projects Completed完成项目数已完成的项目数量
Internships实习经历实习经历情况
Companies Placed就业公司学生被录用的公司
Company Type公司类型公司的类型(如外企、国企、创业公司等)
Domain专业领域就业或研究的专业领域
Salary薪资就业薪资水平
Higher Studies深造情况是否继续深造(读研/读博等)
Higher Studies Field深造领域深造的学术领域
Location所在地就业或深造的地理位置
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?