关于数据集
以下展示的数据集于2022年4月30日使用自定义爬虫程序从 bikez.com 网站抓取的二手摩托车数据集,这些数据集非常适合用于探索性数据分析。
其中名为 all_bikez_raw.csv
的数据集尤其适合练习数据清洗技能。这些数据集也为 Nehal Birla 和 Nishant Verma 提供的这个二手摩托车销售数据集提供了极好的数据扩充。
all_bikez_raw.csv
包含从源网站抓取的原始数据。all_bikez_curated.csv
是原始数据集经过初步预处理后保留的结果,其中只保留了最常用和最相关的属性。许多属性经过了格式清理,但仍有一些工作需要完成。bikez_brands.csv
是一个单列的CSV文件,包含了源网站上存在的所有摩托车品牌名称。我使用这个品牌列表来从原始数据集的”Model”列中提取品牌名称——这项任务对我来说出乎意料地具有挑战性。
文件的属性及其描述摘要:
all_bikez_raw.csv
– 38472 条记录 x 85 个属性all_bikez_curated.csv
– 38472 条记录 x 28 个属性bikez_brands.csv
– 583 条记录
all_bikez_curated.csv
属性描述:
- Brand – 摩托车品牌名称
- Model – 摩托车型号名称
- Year – 摩托车的制造年份
- Category – 摩托车在市场中所属的子类别
- Rating – 5星制评价的平均分
- Displacement (ccm) – 以立方厘米为单位的发动机排量
- Power (hp) – 以马力为单位的最大功率输出,以及峰值功率转速
- Torque (Nm) – 以牛顿米为单位的最大扭矩,以及峰值扭矩转速
- Engine cylinder – 发动机气缸数量及其配置
- Engine stroke – 完成发动机一个做功冲程的阶段数
- Gearbox – 变速箱档位数量
- Bore (mm) – 气缸直径
- Stroke (mm) – 活塞在气缸内的行程距离
- Transmission type – 摩托车传动类型
- Front brakes – 前刹车类型
- Rear brakes – 后刹车类型
- Front tire – 前轮胎尺寸
- Rear tire – 后轮胎尺寸
- Front suspension – 前悬挂类型和配置
- Rear suspension – 后悬挂类型和配置
- Dry weight (kg) – 不含任何液体的摩托车重量
- Wheelbase (mm) – 前后车轮接地点之间的距离
- Fuel capacity (lts) – 油箱最大容量
- Fuel system – 发动机燃油供给系统
- Fuel control – 发动机气门配置
- Seat height (mm) – 座垫底部到地面的高度
- Cooling system – 发动机冷却系统
- Color options – 该特定年份摩托车型号的不同颜色选项

资源下载
下载价格9.9 元
VIP免费
立即购买