关于数据集

网络钓鱼电子邮件数据集

该数据集由研究人员编制,旨在研究网络钓鱼电子邮件策略。它整合了来自各种来源的电子邮件,从而创建了一个全面的分析资源。

初始数据集:

  • Enron 和 Ling 数据集:这些数据集专注于网络钓鱼电子邮件的核心内容,包含主题行、电子邮件正文以及指示电子邮件是垃圾邮件(网络钓鱼)还是合法邮件的标签。
  • CEAS、Nazario、Nigerian Fraud 和 SpamAssassin 数据集:这些数据集为电子邮件提供了更广泛的背景信息,包括发件人信息、收件人信息、日期以及垃圾邮件/合法邮件分类的标签。

最终数据集:

最终数据集将初始数据集中的信息合并为一个资源以供分析。该数据集包含:

  • 约 82,500 封电子邮件
  • 42,891封垃圾邮件
  • 39,595 封合法电子邮件

该数据集使研究人员能够研究网络钓鱼电子邮件的内容及其发送环境,以改进检测方法。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?