关于数据集
该数据集提供了世界城市、国家和语言的结构化视图,源自著名的世界数据库(SQL → CSV)。它旨在方便初学者使用,同时又能为想要探索全球人口统计、人口分布和语言多样性的研究人员、分析师和数据科学家提供强大的功能。
数据集被分成三个干净的关系表:
🔹城市.csv
- 包含有关世界城市的信息。
- 关键列:
ID
→ 唯一城市标识符Name
→ 城市名称CountryCode
→ 将每个城市与其国家联系起来District
→ 行政区划Population
→ 城市人口
🔹国家.csv
- 描述国家及其属性。
- 关键列:
Code
→ 唯一国家代码Name
→ 国家名称Continent
,Region
→ 地理分类SurfaceArea
→ 面积(平方公里)Population
→ 国家人口GovernmentForm
,HeadOfState
→ 政治细节
🔹国家语言.csv
- 捕捉各个国家/地区的语言。
- 关键列:
CountryCode
→ 链接至country.csv
Language
→ 语言名称IsOfficial
→ 该语言是否为官方语言Percentage
→ 人口中使用者的百分比
为什么使用这个数据集?
- 研究全球城市化和人口趋势。
- 探索语言多样性并比较官方和非官方用法。
- 对三个表执行SQL 样式的连接以进行更深入的分析。
- 非常适合数据可视化项目、机器学习实验或教学关系数据库。
可能的用例
- 📊 构建仪表板以按大洲或国家/地区直观显示人口增长情况。
- 🌍 按规模、密度或地区对城市进行排名。
- 🗣️分析全球语言分布和多语言国家。
- 🤖 用作机器学习管道中SQL 查询、连接和规范化的练习数据集。



资源下载
下载价格9.9 元
VIP免费
立即购买