关于数据集
语境
全球海洋是地球气候系统的心脏。它们覆盖了地球表面70%以上的面积,调节着全球天气模式,维持着多样化的生态系统,并支撑着各大洲的经济。厄尔尼诺-南方涛动(ENSO)和其他气候现象是海洋和大气变化的核心,这些现象由全球海面温度波动驱动,引发从干旱到飓风等极端天气事件。
数百个自主浮标——不知疲倦的海洋哨兵——监测着这些广阔而充满活力的水域。这些浮标由美国国家海洋和大气管理局国家数据浮标中心 (NDBC) 运营,为所有主要海盆提供持续、实时的海洋学和气象观测数据。
该数据集汇集了四十多年来这些宝贵的数据,经过精心清理并统一成可立即分析的格式。至关重要的是,它丰富了一个关键的气候指标:海面温度异常。这将原始测量数据转化为可操作的洞察,从而能够研究全球范围内的长期气候变化、海洋振荡和极端气候事件。
内容
该数据集包含部署在所有主要海洋盆地(包括太平洋、大西洋、印度洋和南大洋)的数百个浮标的历史每小时测量数据,数据来源于 NOAA NDBC 公共档案(1980-2024 年)。
数据已经过彻底处理和协调:
- 下载、解析和合并了数千个年度单独文件的数据。
- 不一致的列名和单位在不同时间和站点之间进行了标准化。
- 标准 NOAA 缺失值代码(例如 99、999)被转换为 NaN,以便于分析。
- 设计了与气候相关的关键特征:
- long_term_monthly_avg_temp:针对每个浮标和一年中的每个月(例如八月),计算所有可用年份的长期平均水温。这建立了特定地点的气候基线。
- 温度异常:计算公式为:当前水温 – 长期月平均温度。该异常是监测厄尔尼诺现象(赤道地区正异常)、拉尼娜现象(负异常)、海洋热浪以及更广泛的变暖趋势等气候现象的关键指标。
数据集由三个文件提供:
all_buoys_hourly_data.parquet
:主要的详细数据集,包含每小时的记录。建议用于深入分析。all_buoys_monthly_summary.csv
:较小的聚合数据集,用于快速可视化和高级趋势分析。buoy_metadata_in_water.csv
:包含每个浮标的 ID 和坐标的辅助文件。
all_buoys_hourly_data.parquet
描述
buoy_id
:浮标站的唯一标识符(例如“46050”)。datetime_utc
:协调世界时 (UTC) 的测量时间戳。water_temp_c
:海面温度,单位为摄氏度(°C)。air_temp_c
:浮标处测量的气温,单位为摄氏度 (°C)。wind_speed_ms
:风速,单位为米/秒(m/s)。wave_height_m
:有效波高,单位为米(m)。pressure_hpa
:海平面大气压,单位为百帕(hPa)。latitude
:浮标的纬度(十进制度)。longitude
浮标的经度(以十进制度为单位)。long_term_monthly_avg_temp
:该浮标本日历月的历史平均水温。作为气候基线。temperature_anomaly
:关键气候指标:water_temp_c – long_term_monthly_avg_temp。

资源下载
下载价格9.9 元
VIP免费
立即购买