人工智能生成的新闻与真实新闻:500 条包含元数据和事实核查的记录

关于数据集

该数据集捕捉了2024 年至 2025 年间流传的新闻文章和社交媒体帖子的真实模拟,并标记了可能由人工智能生成的错误信息

它包括500 行 × 31 列,结合了:

  • 时间特征→日期、时间、月份、星期几
  • 基于文本的元数据→平台、地区、语言、主题
  • 定量参与度指标→点赞、分享、评论、点击率、浏览量
  • 内容质量指标→情感极性、毒性分数、可读性指数
  • 事实核查信号→可信度来源评分、人工核查标记、声明验证状态
  • 目标变量→ is_misinformation(0=真实,1=错误信息)

该数据集专为机器学习、深度学习、NLP、数据可视化和预测分析研究而设计。


🎯 用例

该数据集可应用于多个领域:

  • 🧠机器学习/深度学习:错误信息的二元分类
  • 📊数据可视化:参与趋势、区域错误信息热图
  • 🔍 NLP 研究:假新闻检测、文本分类、基于情绪的过滤
  • 🌐博士及学术研究:人工智能错误信息研究、虚假信息传播模型
  • 📈模型评估:特征工程、ROC-AUC、精确率-召回率权衡
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?