关于数据集

📦亚马逊电子产品销售数据集(42K+ 件商品)– 2025 年

该数据集提供了超过 42,000 种亚马逊电子产品的详细信息,包括销售、评分、价格趋势和子类别分布。该数据集有两个版本:
清理文件:经过全面预处理,可用于分析、可视化和机器学习项目;
未清理文件:原始抓取数据,适合想要练习数据清理、预处理和特征工程的用户。该数据集
拥有17 个丰富的特征,非常适合数据科学、机器学习、推荐系统和业务分析。

功能概述

以下是清理后的数据集中包含的关键列(未清理的版本包含或多或少相同的字段):

  • product_title – 产品的完整名称/标题
  • product_rating – 平均客户评分(数字),满分 5 分
  • total_reviews – 客户评论总数
  • purchase_last_month – 上个月购买的单位
  • discounted_price – 折扣后的当前价格
  • original_price – 折扣前的原始标价
  • discount_percentage – 应用于产品的折扣百分比
  • is_best_seller – 表示产品是否被标记为畅销产品
  • is_sponsored – 产品是否为赞助产品或有机产品
  • has_coupon – 特殊折扣优惠券可用性(True/False)
  • buy_box_availability –BuyBox亚马逊搜索页面上的按钮可用性add to cart(nan 值代表 False)
  • delivery_date – 预计交货日期(转换为日期时间格式)
  • sustainability_tags – 环保和可持续发展相关标签
  • product_image_url – 产品直接图片链接
  • product_page_url – 亚马逊官方产品页面 URL
  • data_collected_at – 数据收集日期
  • product_category – 根据标题分配的产品类别

🔍 为什么这个数据集有用?

该数据集为数据科学、机器学习和商业智能开辟了广泛的实际用例,例如:

  • ✔ 价格分析与趋势——研究定价行为、折扣和季节性销售
  • ✔ 客户行为分析——分析评级、评论和销售模式
  • ✔ 推荐系统——构建个性化产品推荐引擎
  • ✔ 市场购物篮分析——识别经常一起购买的相关产品
  • ✔ 预测模型——预测销售、需求和折扣影响
  • ✔ NLP 项目– 使用产品标题进行文本分类和类别预测
  • ✔ 数据清理实践——使用原始文件进行实际的预处理练习

包含的文件:

  1. amazon_products_sales_data_cleaned.csv – 完全清理,可立即使用
  2. amazon_products_sales_data_uncleaned.csv – 用于预处理实践的原始数据

灵感:

亚马逊是全球最大的电商平台之一,了解定价策略、客户评论和销售模式可以帮助企业和分析师获得宝贵的洞察。此数据集提供了执行 EDA、ML 建模和实际分析项目所需的一切。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?