关于数据集
YouTube和TikTok趋势2025
概述
捕获短格式视频性能的全局数据集YouTube短裤和TikTok在2025。
它包括超过50,000个视频记录,有原始格式和机器学习就绪格式。
专为可重现而设计EDA,仪表板,和基线ML建模关于社交媒体参与动态。
包含的文件
| 文件 | 描述 | 形状 |
|---|---|---|
youtube_shorts_tiktok_trends_2025.csv | 具有完整功能集的原始视频级数据 | ~ 48k × ~ 58 |
youtube_shorts_tiktok_trends_2025_ml.csv | ML就绪,清洁和工程版本 | ~ 50k × 32 |
monthly_trends_2025.csv | 月度合计 (2025年1月至8月) | ~ 480 × 8 |
country_platform_summary_2025.csv | 国家 × 平台汇总统计 | ~ 60 × 14 |
top_hashtags_2025.csv | 热门主题标签的排名列表 | ~ 82 × 18 |
top_creators_impact_2025.csv | 创建者级别的影响和影响度量 | ~ 1,000 × 20 |
DATA_DICTIONARY.csv | 列名称和定义 | ~ 58 × 2 |
所有文件都是UTF-8编码、清理和架构对齐以进行直接分析。
键列 (ml-ready文件)
- 标识符:
video_id,platform,country,category,creator_tier - 参与度指标:
views,likes,comments,shares,saves,completions - 派生比率:
engagement_rate = (likes + comments + shares) / views,加上save_rate,share_rate,comment_rate - 信号:速度指标、滚动统计、季节性标志
推荐用途
- EDA:按国家、平台或内容类型分析短表单参与趋势
- ML建模:分类
trend_label或预测engagement_rate和views - 仪表板:可视化全球视频趋势和创作者表现
- 市场调研:研究病毒内容的文化和区域模式
备注
trend_label是快照趋势代理; 基线模型通常在没有时间特征的情况下达到25-35% 的准确性。publish_date_approx是派生的和粗略的-仅适用于趋势方向。- 该数据集包含仅元数据(无媒体内容)。
许可证
CC0 (公共领域)-免费用于研究,教育和项目。

资源下载
下载价格9.9 元
VIP免费
立即购买
