关于数据集
该数据集包含热门书籍的详细信息,包括元数据、评分、类型和用户参与度指标。它非常适合推荐系统、情感分析、流行度预测等相关项目。
🧾 数据集描述
数据集中的每一行代表一本书,并且各列提供丰富的元数据,如下所述:
列名 | 描述 |
---|---|
id | 每本书的唯一标识符。 |
title | 書名。 |
series | 书籍系列的名称(如果适用)。 |
author | 本书的作者,有时包括插图画家。 |
rating | 平均用户评分(例如 4.33)。 |
description | 描述书籍情节或主题的简短摘要或简介。 |
characters | 书中主要人物列表。 |
numRatings | 收到的用户评分总数。 |
ratingsByStars | 从 5 星到 1 星的评级分布(列表格式)。 |
setting | 故事发生的场景或地点。 |
language | 本书所用的语言(例如英语)。 |
genres | 与书籍相关的类型或标签列表(例如,奇幻、青少年、小说)。 |
bookFormat | 书籍格式(例如精装本、平装本、电子书)。 |
edition | 具体版本详情(例如,第一版、美国版)。 |
pages | 书的页数。 |
publisher | 出版社或组织。 |
awards | 获得或提名的文学奖项(列表形式)。 |
likedPercent | 喜欢这本书的用户百分比(例如 96%)。 |
image_url | 书籍封面图片的 URL。 |
price | 列出的书籍价格(例如 5.09 美元)。 |
book_available | 可用性标志(1 = 可用,0 = 不可用)。 |
💡 可能的用例
- 📖 图书推荐系统
- 💬 情感与类型分析
- 📊 用户评分行为建模
- 🏆 奖项预测模型
- 💵 定价与受欢迎程度的相关性

资源下载
下载价格9.9 元
VIP免费
立即购买