关于数据集

概述

该数据集包含美国总统唐纳德·J·特朗普在其第二任期(始于 2025 年 1 月 20 日)期间发布的总统文件的信息。每一行代表一份文件;每一列代表该文件的一个特征。

标题图片来源于Unsplash 上的 Siora Photography

范围

该数据集包括:

(i)截至文件名所示日期,白宫网站“总统行动”页面上列出的所有文件;以及(ii)截至文件名所示日期,可通过联邦公报 API
访问且满足以下条件的所有文件:

{'conditions[type][]': 'PRESDOCU'},
{'conditions[president][]' : 'donald-trump'},
{'conditions[publication_date][gte]' : '2025-01-20'}

转型

提取后,数据经过了转换,以提高可读性。更改包括:

  1. 标准化publication_date格式:MM/DD/YYYY。
  2. 过滤掉重复的title值。*
  3. publication_date按(升序)排序。
  4. 将 NaN、空字符串和空列表替换为 None。
  5. 将《联邦公报》处置记录拆分成四noted_[...]列。
  6. 归因document_number于联邦公报未分配唯一标识符的文件。

*注意:如果《联邦公报》和白宫的文件标题不同,则可能仍然存在重复。

  • title(str) :文档标题
  • document_number(str) :文档的唯一标识符
  • executive_order_number(整数):文件的联邦公报指定的行政命令编号
  • html_url(str) :文档的网址
  • publication_date(’MM/DD/YYYY’ 格式的字符串):文档的发布日期
  • source(str,‘白宫’或‘联邦公报’):文档数据的来源
  • noted_amendments(str):摘自该文件的《联邦公报》处置说明的修订内容
  • noted_reinstatements(str):恢复摘录自该文件的《联邦公报》处置说明
  • noted_recissions(str):摘自《联邦公报》处置记录的撤销记录
  • noted_revocations(str):摘自《联邦公报》处置记录中的撤销记录
  • noted_other(str):该文件的《联邦公报》处置记录中的任何摘录,无法归类到其他四noted_[...]列之一
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?