关于数据集

语境

许多欧洲国家拥有庞大的公共交通铁路网络,连接着大大小小的城市。本数据集包含欧洲(及周边地区)超过 36,000 个火车站的名称、坐标和基本属性。它源自Trainline EU票务网站提供的数据。

请注意,该数据包含俄罗斯和土耳其欧洲地区的几个火车站,以及非洲国家摩洛哥的少数车站。

列描述

  • id:数字内部唯一标识符。主键。
  • name:当地车站名称。这些名称包含重音符号和其他特殊字符。
  • name_norm:标准化版本name;转换为 [A-Za-z] 字符空间(又名“Latin-ASCII”),以将特殊字符替换为标准拉丁字符(例如 è 变为 e,ü 变为 u)。
  • uic:车站的 UIC 代码。UIC 是国际铁路联盟 (International Union of Railways) 的缩写,意为“国际铁路运输行业组织”。本数据集中约有三分之一的车站没有 UIC 代码。
  • longitudelatitude:站点坐标。此数据集中约有 5% 的站点没有坐标。
  • parent_station_id:一个车站可以属于一个元站,其id值为该值,例如,巴黎奥斯特里茨火车站 ( id = 4921) 属于元站巴黎 ( id = 4916)。约 92% 的行包含 NA 条目。
  • country:ISO 3166-1 alpha-2 格式的国家代码(2 位数字)。
  • time_zone:洲/国家 ISO 代码。这些代码似乎与 Olson 名称(例如“欧洲/柏林”)相同。
  • is_city:在源数据集中被标记为“不可靠”。或许值得探究一下这到底意味着什么。
  • is_main_station:在源数据集中被标记为“不可靠”。或许值得探究一下这到底意味着什么。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?