关于数据集
该数据集提供从 IMDb 提取的1920 年至 2025 年期间每年最受欢迎的 500-600 部电影的年度数据。它涵盖了超过 60,000 部电影,涵盖了超过 100 年的电影历史。为了方便使用,每年的数据被拆分为三个 CSV 文件:
imdb_movies_[year].csv:电影基本详情。advanced_movies_details_[year].csv:全面的元数据和财务详细信息。merged_movies_data_[year].csv:结合两个文件的统一数据集。
文件描述
1.imdb_movies_[year].csv
基本电影信息,包括:
Title:电影名称。Description:电影描述。- méta_score:IMDB 的元分数。
Movie Link:电影的 IMDb URL。Year:发行年份。Duration:运行时间(以分钟为单位)。MPA:美国电影协会评级(例如 PG、R)。Rating:IMDb 评分(1-10 级)。Votes:IMDb 上的用户投票总数。
2.advanced_movies_details_[year].csv
详细电影元数据:
Link:IMDb URL(用于链接其他数据)。budget:制作预算(美元)。grossWorldWide:全球票房收入。gross_US_Canada:北美票房收入。opening_weekend_Gross:首映周末收入。directors:董事名单。writers:作家名单。stars:主要演员。genres:电影类型。countries_origin:生产国家。filming_locations:主要拍摄地点。production_companies:相关生产公司。Languages:电影中使用的语言。Award_information:有关奖项、提名和获奖的信息。release_date:正式发布日期。
3.merged_movies_data_[year].csv
结合前两个文件的所有列的统一数据集:
- 基本详情 :
Title,,,。YearRatingVotes - 高级功能:
budget、、、和奖励grossWorldWide。directorsgenres
数据结构
模板列:
imdb_movies_[year].csv:Title, Year, Duration, MPA, Rating, Votes, meta_score, description, Movie Linkadvanced_movies_details_[year].csv:link, writers, directors, stars, budget, opening_weekend_Gross, grossWorldWide, gross_US_Canada, release_date, countries_origin, filming_locations, production_company, awards_content, genres, Languagesmerged_movies_data_[year].csv:Title, Year, Duration, MPA, Rating, Votes, meta_score, description, Movie Link, writers, directors, stars, budget, opening_weekend_Gross, grossWorldWide, gross_US_Canada, release_date, countries_origin, filming_locations, production_company, awards_content, genres, Languages
应用
该数据集非常适合:
- 趋势分析:探索六十年来电影行业的变化。
- 预测模型:建立模型来预测票房收入、收视率或奖项。
- 推荐系统:使用类型、演员阵容和评级等属性进行个性化推荐。
- 比较分析:研究不同时代、不同流派或不同地区的差异。
数据集特征
- 超过 60,000 部电影:从 1920 年到 2025 年的详细数据。
- 丰富的元数据:财务、创意和认可相关属性。
- 用户友好:模块化文件,可定制使用或综合合并文件。
- 一致性:统一的结构可实现无缝分析。

资源下载
下载价格9.9 元
VIP免费
立即购买
