关于数据集

该数据集提供了世界城市、国家和语言的结构化视图,源自著名的世界数据库(SQL → CSV)。它旨在方便初学者使用,同时又能为想要探索全球人口统计、人口分布和语言多样性的研究人员、分析师和数据科学家提供强大的功能。

数据集被分成三个干净的关系表:

🔹城市.csv

  • 包含有关世界城市的信息。
  • 关键列:
    • ID→ 唯一城市标识符
    • Name→ 城市名称
    • CountryCode→ 将每个城市与其国家联系起来
    • District→ 行政区划
    • Population→ 城市人口

🔹国家.csv

  • 描述国家及其属性。
  • 关键列:
    • Code→ 唯一国家代码
    • Name→ 国家名称
    • ContinentRegion→ 地理分类
    • SurfaceArea→ 面积(平方公里)
    • Population→ 国家人口
    • GovernmentFormHeadOfState→ 政治细节

🔹国家语言.csv

  • 捕捉各个国家/地区的语言。
  • 关键列:
    • CountryCode→ 链接至country.csv
    • Language→ 语言名称
    • IsOfficial→ 该语言是否为官方语言
    • Percentage→ 人口中使用者的百分比

为什么使用这个数据集?

  • 研究全球城市化和人口趋势。
  • 探索语言多样性并比较官方和非官方用法。
  • 对三个表执行SQL 样式的连接以进行更深入的分析。
  • 非常适合数据可视化项目机器学习实验教学关系数据库

可能的用例

  • 📊 构建仪表板以按大洲或国家/地区直观显示人口增长情况。
  • 🌍 按规模、密度或地区对城市进行排名。
  • 🗣️分析全球语言分布和多语言国家。
  • 🤖 用作机器学习管道中SQL 查询、连接和规范化的练习数据集。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?