这些是数据集中可用的主要特征/列:
1)航空公司:航空公司名称存储在航空公司列中。这是一个包含 6 家不同航空公司的分类特征。
2)航班:航班存储有关飞机航班代码的信息。它是一个分类特征。
3)出发城市:航班起飞的城市。这是一个分类特征,包含 6 个唯一城市。
4)出发时间:这是一个派生的分类特征,通过将时间段分组创建。它存储有关出发时间的信息,并具有 6 个唯一的时间标签。
5)停靠点:具有 3 个不同值的分类特征,用于存储出发城市和目的地城市之间的停靠点数量。
6)到达时间:这是一个派生的分类特征,通过将时间间隔分组创建。它有六个不同的时间标签,并保存有关到达时间的信息。
7)目的地城市:航班降落的城市。这是一个分类特征,包含 6 个唯一城市。
8)舱位:包含座位等级信息的分类特征;它有两个不同的值:商务舱和经济舱。
9)持续时间:一个连续的功能,以小时为单位显示城市间旅行所需的总时间。
10) 剩余天数:这是通过用预订日期减去旅行日期计算得出的派生特征。
11)价格:目标变量存储票价信息。
不同城市的航空公司航班数据集
各航空公司的航班预订数据集是从一个著名网站上按日期以结构化格式抓取的。该数据集包含印度各城市之间的航班旅行详情记录。其中包含多种特征,例如出发城市和目的地城市、到达和出发时间、航班持续时间和价格等。
该数据以 CSV 文件形式提供。我们将使用 Pandas DataFrame 分析此数据集。
该分析将对航空、旅游领域的从业人员有所帮助。
利用这个数据集,我们在项目中用 Python 回答了多个问题。
Q.1. 数据集中有哪些航空公司?它们的航班频率是多少?
Q.2. 显示代表出发时间和到达时间的条形图。
Q.3. 显示代表出发城市和目的地城市的条形图。
Q.4. 不同航空公司的票价不同吗?
Q.5. 机票价格会根据出发时间和到达时间而变化吗?
Q.6. 价格如何随着来源地和目的地的变化而变化?
Q.7. 出发前1-2天购买机票对价格有何影响?
Q.8. 经济舱和商务舱的票价有何不同?
问:Vistara 航空公司从 德里 飞往 海得拉巴 的商务舱平均票价是多少?
