性格特征数据集:内向、外向和中向性格
📌 概述
该合成数据集旨在根据各种行为和心理特征模拟人类的性格类型——内向型、外向型和中向型。它包含20,000 个条目和30 列,其中包括 29 个代表性格指标的数值特征和 1 个标签列 ( personality_type
)。
该数据集可用于:
- 性格分类
- 对相似的性格特征进行聚类
- 行为分析
- 特征重要性研究
* 教育或实验机器学习项目
📊 数据集结构
列名 | 描述 |
---|---|
personality_type | 目标变量:内向、外向或中向性格 |
social_energy | 倾向于从社交互动中获取能量(0-10) |
alone_time_preference | 孤独中的舒适 |
talkativeness | 参与对话的倾向 |
deep_reflection | 深度或内省思考的频率 |
group_comfort | 在团体环境中轻松自在 |
party_liking | 享受聚会和社交活动 |
listening_skill | 积极倾听能力 |
empathy | 理解他人情绪的能力 |
creativity | 创造性思维倾向 |
organization | 偏好秩序、结构和计划 |
leadership | 领导他人时的舒适感 |
risk_taking | 愿意承担风险 |
public_speaking_comfort | 公开演讲时的舒适度 |
curiosity | 对学习或探索的兴趣 |
routine_preference | 偏好常规而非自发性 |
excitement_seeking | 渴望新的、刺激的体验 |
friendliness | 普遍的社会温暖和平易近人 |
emotional_stability | 在压力下保持冷静和平衡的能力 |
planning | 提前计划的倾向 |
spontaneity | 冲动行事或无计划行事 |
adventurousness | 愿意尝试新的、有风险的活动 |
reading_habit | 阅读书籍或文章的频率 |
sports_interest | 对体育运动或体育活动的兴趣程度 |
online_social_usage | 在社交媒体和在线互动上花费的时间 |
travel_desire | 对旅行和探索新地方的兴趣 |
gadget_usage | 小工具或科技设备的使用频率 |
work_style_collaborative | 更喜欢团队合作而不是单独工作 |
decision_speed | 决策速度有多快 |
stress_handling | 有效管理压力的能力 |
所有特征值均为数字,范围从0(低)到10(高)。
⚙️ 它是如何生成的
- 该数据集是使用Python和NumPy合成生成的。
- 特征分布采用特定类别的均值建模,并使用正态分布添加噪声来模拟自然变化。
* 班级平衡:~33% 内向者,34% 外向者,33% 中间性格者。
📂 使用思路
PCA 或 t-SNE 用于可视化个性分布
训练和评估分类模型(逻辑回归、随机森林、XGBoost 等)
无监督聚类(KMeans、DBSCAN)用于发现个性分组

资源下载
下载价格9.9 元
VIP免费
立即购买