关于数据集

概述

学生社交媒体与关系数据集包含学生社交媒体行为及相关生活结果的匿名记录。该数据集涵盖多个国家和学术水平,重点关注使用强度、平台偏好和关系动态等关键维度。每行代表一名学生的调查回复,提供适用于统计分析和机器学习应用的横截面快照。

范围和覆盖范围

  • 人口: 16-25 岁就读高中、本科或研究生课程的学生。
  • 地理:覆盖多个国家(例如孟加拉国、印度、美国、英国、加拿大、澳大利亚、德国、巴西、日本、韩国)。
  • 时间范围:通过 2025 年第一季度进行的一次性在线调查收集数据。
  • 数量:根据研究需要可配置样本大小(例如 100、500、1,000 条记录)。

数据收集与方法

  1. 调查设计:问题改编自经过验证的社交媒体成瘾量表(例如,卑尔根社交媒体成瘾量表)和关系冲突指数。
  2. 招募:通过大学邮件列表和社交媒体平台招募参与者,确保学术水平和国家多样性。
  3. 数据质量控制:
    • 验证:必填字段和范围检查(例如,使用时间在 0-24 之间)。
    • 去重:通过唯一的 Student_ID 检查删除重复的条目。
    • 匿名化:不收集任何个人身份信息。

关键变量

多变的类型描述
学生 ID整数唯一受访者标识符
年龄整数年龄(岁)
性别分类“男女不限”
学术水平分类高中/本科/研究生
国家分类居住国家
平均每日使用小时数漂浮每天在社交媒体上的平均时间
最常用的平台分类Instagram、Facebook、TikTok 等
影响学业成绩布尔值自我报告对学业的影响(是/否)
每晚睡眠时间漂浮平均每晚睡眠时间
心理健康评分整数自我评价心理健康状况(1 = 差至 10 = 优秀)
关系状态分类单身 / 恋爱中 / 复杂
社交媒体冲突整数社交媒体导致的关系冲突数量
上瘾分数整数社交媒体成瘾评分(1 = 低至 10 = 高)

潜力分析

  • 相关性研究:检查每日使用时间与心理健康分数或睡眠时间之间的关联。
  • 预测模型:根据使用模式和平台类型构建分类器来预测关系冲突。
  • 聚类:识别不同国家的用户群体(例如,“高使用率高压力”与“中等使用率平衡”)。

限制

  • 自我报告偏差:所有测量都是自我报告的,可能会受到社会期望效应的影响。
  • 横断面设计:一次性调查可避免因果推断。
  • 抽样变异性:通过在线渠道招聘可能无法充分代表互联网访问受限的学生。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?