​关于数据集​​​

​以下展示的数据集于2022年4月30日使用自定义爬虫程序从 bikez.com 网站抓取的二手摩托车数据集,这些数据集非常适合用于探索性数据分析。

其中名为 all_bikez_raw.csv的数据集尤其适合练习数据清洗技能。这些数据集也为 Nehal Birla 和 Nishant Verma 提供的这个二手摩托车销售数据集提供了极好的数据扩充。

  • all_bikez_raw.csv包含从源网站抓取的原始数据。
  • all_bikez_curated.csv是原始数据集经过初步预处理后保留的结果,其中只保留了最常用和最相关的属性。许多属性经过了格式清理,但仍有一些工作需要完成。
  • bikez_brands.csv是一个单列的CSV文件,包含了源网站上存在的所有摩托车品牌名称。我使用这个品牌列表来从原始数据集的”Model”列中提取品牌名称——这项任务对我来说出乎意料地具有挑战性。

文件的属性及其描述摘要:

  • all_bikez_raw.csv– 38472 条记录 x 85 个属性
  • all_bikez_curated.csv– 38472 条记录 x 28 个属性
  • bikez_brands.csv– 583 条记录

all_bikez_curated.csv属性描述:​

  • ​Brand​​ – 摩托车品牌名称
  • ​Model​​ – 摩托车型号名称
  • ​Year​​ – 摩托车的制造年份
  • ​Category​​ – 摩托车在市场中所属的子类别
  • ​Rating​​ – 5星制评价的平均分
  • ​Displacement (ccm)​​ – 以立方厘米为单位的发动机排量
  • ​Power (hp)​​ – 以马力为单位的最大功率输出,以及峰值功率转速
  • ​Torque (Nm)​​ – 以牛顿米为单位的最大扭矩,以及峰值扭矩转速
  • ​Engine cylinder​​ – 发动机气缸数量及其配置
  • ​Engine stroke​​ – 完成发动机一个做功冲程的阶段数
  • ​Gearbox​​ – 变速箱档位数量
  • ​Bore (mm)​​ – 气缸直径
  • ​Stroke (mm)​​ – 活塞在气缸内的行程距离
  • ​Transmission type​​ – 摩托车传动类型
  • ​Front brakes​​ – 前刹车类型
  • ​Rear brakes​​ – 后刹车类型
  • ​Front tire​​ – 前轮胎尺寸
  • ​Rear tire​​ – 后轮胎尺寸
  • ​Front suspension​​ – 前悬挂类型和配置
  • ​Rear suspension​​ – 后悬挂类型和配置
  • ​Dry weight (kg)​​ – 不含任何液体的摩托车重量
  • ​Wheelbase (mm)​​ – 前后车轮接地点之间的距离
  • ​Fuel capacity (lts)​​ – 油箱最大容量
  • ​Fuel system​​ – 发动机燃油供给系统
  • ​Fuel control​​ – 发动机气门配置
  • ​Seat height (mm)​​ – 座垫底部到地面的高度
  • ​Cooling system​​ – 发动机冷却系统
  • ​Color options​​ – 该特定年份摩托车型号的不同颜色选项
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?