关于数据集

YouTube和TikTok趋势2025

概述

捕获短格式视频性能的全局数据集YouTube短裤TikTok2025
它包括超过50,000个视频记录,有原始格式和机器学习就绪格式。
专为可重现而设计EDA,仪表板,和基线ML建模关于社交媒体参与动态。


包含的文件

文件描述形状
youtube_shorts_tiktok_trends_2025.csv具有完整功能集的原始视频级数据~ 48k × ~ 58
youtube_shorts_tiktok_trends_2025_ml.csvML就绪,清洁和工程版本~ 50k × 32
monthly_trends_2025.csv月度合计 (2025年1月至8月)~ 480 × 8
country_platform_summary_2025.csv国家 × 平台汇总统计~ 60 × 14
top_hashtags_2025.csv热门主题标签的排名列表~ 82 × 18
top_creators_impact_2025.csv创建者级别的影响和影响度量~ 1,000 × 20
DATA_DICTIONARY.csv列名称和定义~ 58 × 2

所有文件都是UTF-8编码、清理和架构对齐以进行直接分析。


键列 (ml-ready文件)

  • 标识符: video_id,platform,country,category,creator_tier
  • 参与度指标: views,likes,comments,shares,saves,completions
  • 派生比率: engagement_rate = (likes + comments + shares) / views,加上save_rate,share_rate,comment_rate
  • 信号:速度指标、滚动统计、季节性标志

推荐用途

  • EDA:按国家、平台或内容类型分析短表单参与趋势
  • ML建模:分类trend_label或预测engagement_rateviews
  • 仪表板:可视化全球视频趋势和创作者表现
  • 市场调研:研究病毒内容的文化和区域模式

备注

  • trend_label是快照趋势代理; 基线模型通常在没有时间特征的情况下达到25-35% 的准确性。
  • publish_date_approx是派生的和粗略的-仅适用于趋势方向。
  • 该数据集包含仅元数据(无媒体内容)。

许可证

CC0 (公共领域)-免费用于研究,教育和项目。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?