2380 款 Steam 畅销游戏:来自 GameFAQs 和 SteamDB 的丰富数据集。

介绍与数据收集

该数据集全面展现了 Steam 平台上最畅销的游戏。数据收集于 2025 年 6 月 1 日,来自 Steam 商店官方“畅销游戏”页面。

为了确保对畅销书有广泛和全面的了解,数据是在特定的过滤条件下收集的:

  • 在“按语言缩小范围”类别中,未选择特定语言。
  • 在“显示选定类型”类别中,仅选中了“游戏”。
  • 收集过程中未使用任何其他筛选条件或标签。
    此方法旨在提供一份中立且全面的游戏列表,涵盖目前平台上全球最畅销的游戏。

最终数据集包含 2,380 个符合所有收集和处理标准的独特游戏。

该数据集的一个关键特征是user_defined_tags专栏的精心策划。我们并未使用 Steam 上所有可能标签的庞大且有时杂乱的频谱,而是建立了一个包含 42 个独特且具有代表性的游戏类型和标签的标准化词汇表。数据集中的每个游戏都使用这 42 个标签的子集进行描述。采用这种方法是为了确保一致性,并提供更清晰的特征集以供分析,旨在用最少但全面的词汇有效地表示每个游戏。

列描述

以下是数据集中每一列的详细描述。

  • game_name:游戏的官方名称。
  • reviews_like_rate:来自 Steam 用户评论的推荐率(例如,“100 条评论中有 95% 是正面的”)。
  • all_reviews_number:该游戏在 Steam 上收到的用户评论总数。
  • release_date:游戏在 Steam 平台上的正式发布日期。这包括抢先体验版游戏的初始发布日期。
  • developer:游戏背后的主要开发商或工作室。
  • user_defined_tags:Steam 社区为游戏分配的一组类型和类别(例如“RPG”、“开放世界”、“故事丰富”)。
  • supported_os:游戏官方支持的操作系统列表(win、mac、linux)。
  • supported_languages:游戏支持的界面、音频或字幕的语言列表。
  • price:游戏价格。注意:货币为 MENA(美元),这是中东和北非地区的区域价格,而非标准美元。0此列中的值为 表示游戏为“免费游戏”。
  • other_features:Steam 在“玩家支持”类别下定义的一组功能(例如,“单人游戏”、“在线 PvP”、“Steam 成就”、“家庭共享”、“在线合作”、“支持 VR”)。
  • age_restriction:游戏内容的建议年龄限制,编码如下:0(所有人)、10(10+)、13(13+)、17(17+)。
  • rating:用户对游戏的总体评分,范围为 1 到 5,其中 1 为最低,5 为最高。
  • difficulty:玩家感知的游戏难度估计值,按 1 到 5 的等级划分,其中 1 表示最简单,5 表示最难。
  • length:玩家完成或充分体验游戏所花费的平均时间(以小时为单位)。对于此数据集,该值的最大上限为 80 小时。
  • estimated_downloads:该游戏的预计拥有者总数。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?