关于数据集
语境
许多欧洲国家拥有庞大的公共交通铁路网络,连接着大大小小的城市。本数据集包含欧洲(及周边地区)超过 36,000 个火车站的名称、坐标和基本属性。它源自Trainline EU票务网站提供的数据。
请注意,该数据包含俄罗斯和土耳其欧洲地区的几个火车站,以及非洲国家摩洛哥的少数车站。
列描述
id
:数字内部唯一标识符。主键。name
:当地车站名称。这些名称包含重音符号和其他特殊字符。name_norm
:标准化版本name
;转换为 [A-Za-z] 字符空间(又名“Latin-ASCII”),以将特殊字符替换为标准拉丁字符(例如 è 变为 e,ü 变为 u)。uic
:车站的 UIC 代码。UIC 是国际铁路联盟 (International Union of Railways) 的缩写,意为“国际铁路运输行业组织”。本数据集中约有三分之一的车站没有 UIC 代码。longitude
&latitude
:站点坐标。此数据集中约有 5% 的站点没有坐标。parent_station_id
:一个车站可以属于一个元站,其id
值为该值,例如,巴黎奥斯特里茨火车站 (id = 4921
) 属于元站巴黎 (id = 4916
)。约 92% 的行包含 NA 条目。country
:ISO 3166-1 alpha-2 格式的国家代码(2 位数字)。time_zone
:洲/国家 ISO 代码。这些代码似乎与 Olson 名称(例如“欧洲/柏林”)相同。is_city
:在源数据集中被标记为“不可靠”。或许值得探究一下这到底意味着什么。is_main_station
:在源数据集中被标记为“不可靠”。或许值得探究一下这到底意味着什么。

资源下载
下载价格9.9 元
VIP免费
立即购买