关于数据集
您是否想过,在电商网站上,“只逛不买”的顾客和真正付费的顾客之间究竟有何区别?此数据集提供了客户旅程的详细会话视图,记录了从抵达到最终购买的每个步骤。
该数据集通过人工合成的方式模拟真实用户行为,对于任何对营销分析、用户行为建模和转化率优化感兴趣的人而言,都是一个理想的平台。其主要挑战在于根据用户的浏览模式预测会话是否会促成购买。
内容:
该数据集包含一个 customer_journey.csv 文件,其中每一行代表用户会话中的一个事件。一个 SessionID 可以包含多行,按时间顺序详细记录用户所经历的路径。
列:
SessionID:(分类)每个用户会话的唯一标识符。
UserID:(分类)每个用户的唯一标识符。
时间戳:(时间戳)事件发生的日期和时间。
PageType:(分类)访问的页面类型(主页、产品页面、购物车、结帐、确认)。
设备类型:(分类)用于会话的设备(台式机、移动设备、平板电脑)。
国家/地区:(分类)用户所在的国家/地区。
ReferralSource:(分类)引导用户访问网站的来源(谷歌、社交媒体、直接、电子邮件)。
TimeOnPage_seconds:(数字)用户在特定页面上花费的时间(以秒为单位)。
ItemsInCart:(数字)事件发生时用户购物车中的商品数量。
购买:(布尔/二进制)目标变量。如果在会话期间进行了购买,则为 1,否则为 0。此值在给定 SessionID 的所有事件中保持一致。
潜在用例和灵感✨
转化预测(分类):您能否建立一个模型来高精度地预测购买变量?
漏斗分析 (EDA):漏斗每个阶段(主页 -> 产品 -> 购物车 -> 结帐)的流失率是多少?
用户细分(聚类):您能否根据用户的浏览行为识别不同的用户群体(例如,“廉价商品猎人”、“果断买家”)?
序列分析(高级):您可以使用 LSTM 等序列模型来预测用户的下一步动作吗?
