关于数据集
该数据集包含10,000个综合生成的记录,模拟从印度大学毕业的学生的学术和职业成果,主要关注工程和管理流。
此合成数据集的主要目标是为以下内容提供丰富的非敏感资源:
预测建模:训练机器学习模型以预测工作安置成功 (分类) 和最终CTC/薪水 (回归)。
偏差分析:在受控的模拟环境中探索分类变量 (如性别或大学级别) 对安置和工资结果的影响。
** 探索性数据分析 (EDA): ** 调查学习成绩 (CGPA,项目,实习) 和职业道路 (放置与更高的研究) 之间的相关性。
关于合成的关键注意事项
这些数据是合成的,不包含任何真实的个人身份信息 (PII)。
列说明:
| 英文字段名 | 中文翻译 | 说明 |
|---|---|---|
| Student ID | 学生ID | 学生的唯一标识符 |
| Name | 姓名 | 学生姓名 |
| Gender | 性别 | 学生性别 |
| Year | 入学年份/年级 | 入学年份或所在年级 |
| Skills | 技能 | 学生掌握的技能集合 |
| Backlogs | 未通过科目数 | 挂科或未通过的科目数量 |
| Projects Completed | 完成项目数 | 已完成的项目数量 |
| Internships | 实习经历 | 实习经历情况 |
| Companies Placed | 就业公司 | 学生被录用的公司 |
| Company Type | 公司类型 | 公司的类型(如外企、国企、创业公司等) |
| Domain | 专业领域 | 就业或研究的专业领域 |
| Salary | 薪资 | 就业薪资水平 |
| Higher Studies | 深造情况 | 是否继续深造(读研/读博等) |
| Higher Studies Field | 深造领域 | 深造的学术领域 |
| Location | 所在地 | 就业或深造的地理位置 |

资源下载
下载价格9.9 元
VIP免费
立即购买
