关于数据集

该数据集提供了一个虚构约会应用上用户行为的综合表征。它包含 50,000 条记录,其中包含 19 个特征,涵盖人口统计详情、应用使用模式、滑动倾向和匹配结果。该数据以编程方式生成,用于模拟真实的用户交互,非常适合探索性数据分析 (EDA)、机器学习建模(例如预测匹配结果)或研究在线约会平台中的用户行为趋势。

主要特征包括性别、性取向、位置类型、收入等级、教育水平、用户兴趣、应用使用时长、滑动比例、获得的点赞数、相互匹配以及匹配结果(例如“相互匹配”、“消失”、“被骗”)。该数据集旨在实现多样性和平衡性,包含分类、数值和标记变量,可用于各种分析目的。

用法

该数据集可用于:

探索性数据分析 (EDA):探究人口统计数据、应用使用情况和匹配成功率之间的相关性。
机器学习:构建模型预测匹配结果或用户参与度。
社会研究:分析不同人群在约会应用上的行为趋势。
特征工程实践:尝试转换分类数据和数值数据。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?