关于数据集

语境

全球海洋是地球气候系统的心脏。它们覆盖了地球表面70%以上的面积,调节着全球天气模式,维持着多样化的生态系统,并支撑着各大洲的经济。厄尔尼诺-南方涛动(ENSO)和其他气候现象是海洋和大气变化的核心,这些现象由全球海面温度波动驱动,引发从干旱到飓风等极端天气事件。

数百个自主浮标——不知疲倦的海洋哨兵——监测着这些广阔而充满活力的水域。这些浮标由美国国家海洋和大气管理局国家数据浮标中心 (NDBC) 运营,为所有主要海盆提供持续、实时的海洋学和气象观测数据。

该数据集汇集了四十多年来这些宝贵的数据,经过精心清理并统一成可立即分析的格式。至关重要的是,它丰富了一个关键的气候指标:海面温度异常。这将原始测量数据转化为可操作的洞察,从而能够研究全球范围内的长期气候变化、海洋振荡和极端气候事件。

内容

该数据集包含部署在所有主要海洋盆地(包括太平洋、大西洋、印度洋和南大洋)的数百个浮标的历史每小时测量数据,数据来源于 NOAA NDBC 公共档案(1980-2024 年)。

数据已经过彻底处理和协调:

  • 下载、解析和合并了数千个年度单独文件的数据。
  • 不一致的列名和单位在不同时间和站点之间进行了标准化。
  • 标准 NOAA 缺失值代码(例如 99、999)被转换为 NaN,以便于分析。
  • 设计了与气候相关的关键特征:
    • long_term_monthly_avg_temp:针对每个浮标和一年中的每个月(例如八月),计算所有可用年份的长期平均水温。这建立了特定地点的气候基线。
    • 温度异常:计算公式为:当前水温 – 长期月平均温度。该异常是监测厄尔尼诺现象(赤道地区正异常)、拉尼娜现象(负异常)、海洋热浪以及更广泛的变暖趋势等气候现象的关键指标。

数据集由三个文件提供:

  • all_buoys_hourly_data.parquet:主要的详细数据集,包含每小时的记录。建议用于深入分析。
  • all_buoys_monthly_summary.csv:较小的聚合数据集,用于快速可视化和高级趋势分析。
  • buoy_metadata_in_water.csv:包含每个浮标的 ID 和坐标的辅助文件。

all_buoys_hourly_data.parquet描述

  • buoy_id:浮标站的唯一标识符(例如“46050”)。
  • datetime_utc:协调世界时 (UTC) 的测量时间戳。
  • water_temp_c:海面温度,单位为摄氏度(°C)。
  • air_temp_c:浮标处测量的气温,单位为摄氏度 (°C)。
  • wind_speed_ms:风速,单位为米/秒(m/s)。
  • wave_height_m:有效波高,单位为米(m)。
  • pressure_hpa:海平面大气压,单位为百帕(hPa)。
  • latitude:浮标的纬度(十进制度)。
  • longitude浮标的经度(以十进制度为单位)。
  • long_term_monthly_avg_temp:该浮标本日历月的历史平均水温。作为气候基线。
  • temperature_anomaly:关键气候指标:water_temp_c – long_term_monthly_avg_temp。
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?