关于数据集

该数据集包含热门书籍的详细信息,包括元数据、评分、类型和用户参与度指标。它非常适合推荐系统、情感分析、流行度预测等相关项目。


🧾 数据集描述

数据集中的每一行代表一本书,并且各列提供丰富的元数据,如下所述:

列名描述
id每本书的唯一标识符。
title書名。
series书籍系列的名称(如果适用)。
author本书的作者,有时包括插图画家。
rating平均用户评分(例如 4.33)。
description描述书籍情节或主题的简短摘要或简介。
characters书中主要人物列表。
numRatings收到的用户评分总数。
ratingsByStars从 5 星到 1 星的评级分布(列表格式)。
setting故事发生的场景或地点。
language本书所用的语言(例如英语)。
genres与书籍相关的类型或标签列表(例如,奇幻、青少年、小说)。
bookFormat书籍格式(例如精装本、平装本、电子书)。
edition具体版本详情(例如,第一版、美国版)。
pages书的页数。
publisher出版社或组织。
awards获得或提名的文学奖项(列表形式)。
likedPercent喜欢这本书的用户百分比(例如 96%)。
image_url书籍封面图片的 URL。
price列出的书籍价格(例如 5.09 美元)。
book_available可用性标志(1 = 可用,0 = 不可用)。

💡 可能的用例

  • 📖 图书推荐系统
  • 💬 情感与类型分析
  • 📊 用户评分行为建模
  • 🏆 奖项预测模型
  • 💵 定价与受欢迎程度的相关性
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?