关于数据集
概述
该数据集包含美国总统唐纳德·J·特朗普在其第二任期(始于 2025 年 1 月 20 日)期间发布的总统文件的信息。每一行代表一份文件;每一列代表该文件的一个特征。
标题图片来源于Unsplash 上的 Siora Photography。
范围
该数据集包括:
(i)截至文件名所示日期,白宫网站“总统行动”页面上列出的所有文件;以及(ii)截至文件名所示日期,可通过联邦公报 API
访问且满足以下条件的所有文件:
{'conditions[type][]': 'PRESDOCU'},
{'conditions[president][]' : 'donald-trump'},
{'conditions[publication_date][gte]' : '2025-01-20'}
转型
提取后,数据经过了转换,以提高可读性。更改包括:
- 标准化
publication_date
格式:MM/DD/YYYY。 - 过滤掉重复的
title
值。* publication_date
按(升序)排序。- 将 NaN、空字符串和空列表替换为 None。
- 将《联邦公报》处置记录拆分成四
noted_[...]
列。 - 归因
document_number
于联邦公报未分配唯一标识符的文件。
*注意:如果《联邦公报》和白宫的文件标题不同,则可能仍然存在重复。
列
title
(str) :文档标题document_number
(str) :文档的唯一标识符executive_order_number
(整数):文件的联邦公报指定的行政命令编号html_url
(str) :文档的网址publication_date
(’MM/DD/YYYY’ 格式的字符串):文档的发布日期source
(str,‘白宫’或‘联邦公报’):文档数据的来源noted_amendments
(str):摘自该文件的《联邦公报》处置说明的修订内容noted_reinstatements
(str):恢复摘录自该文件的《联邦公报》处置说明noted_recissions
(str):摘自《联邦公报》处置记录的撤销记录noted_revocations
(str):摘自《联邦公报》处置记录中的撤销记录noted_other
(str):该文件的《联邦公报》处置记录中的任何摘录,无法归类到其他四noted_[...]
列之一

资源下载
下载价格9.9 元
VIP免费
立即购买