关于数据集
📦亚马逊电子产品销售数据集(42K+ 件商品)– 2025 年
该数据集提供了超过 42,000 种亚马逊电子产品的详细信息,包括销售、评分、价格趋势和子类别分布。该数据集有两个版本:
清理文件:经过全面预处理,可用于分析、可视化和机器学习项目;
未清理文件:原始抓取数据,适合想要练习数据清理、预处理和特征工程的用户。该数据集
拥有17 个丰富的特征,非常适合数据科学、机器学习、推荐系统和业务分析。
功能概述
以下是清理后的数据集中包含的关键列(未清理的版本包含或多或少相同的字段):
- product_title – 产品的完整名称/标题
- product_rating – 平均客户评分(数字),满分 5 分
- total_reviews – 客户评论总数
- purchase_last_month – 上个月购买的单位
- discounted_price – 折扣后的当前价格
- original_price – 折扣前的原始标价
- discount_percentage – 应用于产品的折扣百分比
- is_best_seller – 表示产品是否被标记为畅销产品
- is_sponsored – 产品是否为赞助产品或有机产品
- has_coupon – 特殊折扣优惠券可用性(True/False)
- buy_box_availability –
BuyBox
亚马逊搜索页面上的按钮可用性add to cart
(nan 值代表 False) - delivery_date – 预计交货日期(转换为日期时间格式)
- sustainability_tags – 环保和可持续发展相关标签
- product_image_url – 产品直接图片链接
- product_page_url – 亚马逊官方产品页面 URL
- data_collected_at – 数据收集日期
- product_category – 根据标题分配的产品类别
🔍 为什么这个数据集有用?
该数据集为数据科学、机器学习和商业智能开辟了广泛的实际用例,例如:
- ✔ 价格分析与趋势——研究定价行为、折扣和季节性销售
- ✔ 客户行为分析——分析评级、评论和销售模式
- ✔ 推荐系统——构建个性化产品推荐引擎
- ✔ 市场购物篮分析——识别经常一起购买的相关产品
- ✔ 预测模型——预测销售、需求和折扣影响
- ✔ NLP 项目– 使用产品标题进行文本分类和类别预测
- ✔ 数据清理实践——使用原始文件进行实际的预处理练习
包含的文件:
- amazon_products_sales_data_cleaned.csv – 完全清理,可立即使用
- amazon_products_sales_data_uncleaned.csv – 用于预处理实践的原始数据
灵感:
亚马逊是全球最大的电商平台之一,了解定价策略、客户评论和销售模式可以帮助企业和分析师获得宝贵的洞察。此数据集提供了执行 EDA、ML 建模和实际分析项目所需的一切。

资源下载
下载价格9.9 元
VIP免费
立即购买