关于数据集
该数据集模拟了一家家具公司的历史需求数据,捕捉了季节性和促销变化。它涵盖了影响需求的关键因素,例如定价、促销、竞争对手影响、经济状况和天气影响。
数据集特征:
date ——表示销售日期的时间戳。
product_id(int)– 产品的唯一标识符。
sales_units(int)– 特定日期售出的单位数量。
holiday_season(int:0 或 1)– 表示日期是否属于假期季节(1)或不属于假期季节(0)。
promotion_applied(int:0 或 1)– 表示是否应用了促销折扣(1)或未应用(0)。
competitor_price_index(浮点数)– 竞争对手定价指数,代表市场上同类产品的相对价格。
economic_index(浮点数)——以指数表示的经济状况(值越高,经济状况越好)。
weather_impact(int:0、1 或 2)– 表示天气对销售的影响(0:无影响,1:中等,2:影响较大)。
price(浮点数)——产品的售价。
discount_percentage(浮点数)– 应用于产品的折扣百分比。
sales_revenue(浮点数)- 销售产生的总收入(计算方式为 sales_units * price * (1 – discount_percentage/100))。
region_Europe (bool) – 销售是否发生在欧洲 (1) 或不发生 (0)。
region_North America (bool) – 销售是否发生在北美 (1) 或不发生在北美 (0)。
store_type_Retail (bool) – 商店类型是否为零售 (1) 或非零售 (0)。
store_type_Wholesale(布尔值)– 商店类型是批发(1)还是非批发(0)。
category_Cabinets (bool) – 产品是否属于“橱柜”类别 (1)。
category_Chairs (bool) – 产品是否属于“椅子”类别 (1)。
category_Sofas(布尔值)– 产品是否属于“沙发”类别(1)。
category_Tables(布尔值)– 产品是否属于“表格”类别(1)。
future_demand(浮点数)[目标变量] – 预测产品的未来需求。
