关于数据集
城市洪涝风险数据集
概述
该合成数据集对全球各城市的微区域(“片段”)进行分类,以评估城市雨水(降雨驱动)洪水风险。每条记录代表一个空间片段,其中包含地理坐标、当地水文背景、排水基础设施特征、降雨来源和强度以及定性/观测风险标签。该数据集整合了多个全球海拔和陆地数据集、本地/远程降雨来源以及基础设施接近度指标,以支持热点检测、风险评分、模型训练和运营监控。
预期用途
- 确定积水热点和低洼地段,以便有针对性地进行排水维护。
- 结合海拔、排水密度、雨水排水沟距离以及降雨强度和重现期来确定基本工程的优先顺序。
- 校准/验证洪涝水文和水力模型(例如,使用排水密度和土壤组作为先验)。
- 使用标签(例如“ponding_hotspot”、“extreme_rain_history”、日期事件标志)构建用于风险分类或事件预测的 ML 模型。
- 支持按城市、区和集水区进行事件响应的仪表板和 SOP。
空间与时间笔记
- 空间粒度:与城市、行政区和集水区 ID 相关联的经纬度分段级点。
- 时间背景:历史/观测到的降雨强度和重现期;事件标签包括风险标签内的 ISO 类日期(例如,event_2025-03-21)。
数据质量和缺失值
- 某些字段可能为空或包含哨兵值(例如,低于海平面的海拔为 -3.0 或缺失/不精确的 DEM 斑块)。
- 当基础设施地图不完整时,可能不存在接近度和密度指标。
- 当没有指定来源时,降雨源可以是“无”;未映射段的雨水排水沟邻近性可能缺失。
- 风险标签可以使用管道分隔符进行多值化。
列字典
| 柱子 | 类型 | 描述 | 示例值 | 笔记 |
|---|---|---|---|---|
| 段 ID | 细绳 | 段的唯一标识符 | SEG-00001 | 稳定的主键 |
| 城市名称 | 细绳 | 城市和国家标签 | “斯里兰卡科伦坡” | 自由文本,包括国家 |
| 管理员 | 细绳 | 市内行政单位 | “D区”、“18区” | 因城市命名而异 |
| 纬度 | 漂浮 | 分段纬度(WGS84) | 6.920633 | 十进制度 |
| 经度 | 漂浮 | 分段经度(WGS84) | 79.9126 | 十进制度 |
| 集水区 ID | 细绳 | 当地水文集水区标识符 | CAT-136 | 将路段连接至集水区 |
| 海拔_米 | 漂浮 | 路段中心地面高程(m) | 21.57, -3.0 | -3.0 可能表示低于海平面或填充值 |
| dem_source | 细绳 | 数字高程模型来源 | SRTM_1arc,哥白尼_GLO-30_v2023 | SRTM/Copernicus/EEA 变体的混合 |
| 土地利用 | 细绳 | 主要土地利用类型 | 住宅、商业、道路、水、绿地、混合、机构、工业、非正式 | 分类,可以为空白 |
| 土壤组 | 细绳 | 水文土壤组(入渗类) | A、B、C、D | 字母越大,渗透性越低 |
| 排水密度(每平方公里) | 漂浮 | 单位面积排水长度(公里/平方公里) | 4.27, 8.62 | 如果功能正常,更高的密度可能会减少积水 |
| storm_drain_proximity_m | 漂浮 | 距最近雨水排放设施的距离(米) | 57.0, 210.5 | 较小=更接近排水系统 |
| storm_drain_type | 细绳 | 最近的排水资产类型 | CurbInlet、GratedInlet、人孔、明渠、无 | 基础设施子类型 |
| 降雨源 | 细绳 | 降雨强度数据来源 | ERA5、IMD、LocalGauge、混合、无 | 重新分析、测量或混合 |
| 历史降雨强度(毫米/小时) | 漂浮 | 代表性(历史)强度(毫米/小时) | 33.4, 106.0 | 与设计条件的重现期一起使用 |
| 回报期年数 | 整数 | 强度统计重现期 | 2、5、10、25、50、100 | 标准水文 RP |
| 风险标签 | 细绳 | 管道分隔的风险标签和事件 | 积水热点、低洼、稀疏排水、极端降雨历史、事件_YYYY-MM-DD | 多标签;可能为空 |
标签语义
- ponding_hotspot:地表水反复积聚的经验证据或模型证据。
- low_lying:相对于周围环境而言的凹陷地形;通常与负/低海拔或盆地几何形状一致。
- sparse_drainage:有限或遥远的雨水资产;通常 storm_drain_proximity_m 较高或密度较低。
- extreme_rain_history:标记该路段附近历史高强度事件或异常。
- event_YYYY-MM-DD:与洪水/积水或极端降雨相关的具体记录/事件日期。
集成技巧
- 通过 catchment_id 连接来汇总子集水区/集水区规模的风险。
- 将 elevation_m、land_use、soil_group 和 drainage_density_km_per_km2 结合起来形成综合风险指数。
- 使用 rain_source 和 return_period_years 来协调不同地区的强度输入。
- 通过“|”解析risk_labels,为分类任务构建多热目标。
- 谨慎对待“无”或缺失的基础设施字段,以避免风险评估中出现乐观偏差。
已知的边缘情况
- 沿海/河流段可能在高分辨率 DEM 中显示负的 elevation_m;请使用当地基准进行验证。
- 由于地势平坦、土壤压实或排水口堵塞,水域/绿地用途仍会出现积水。
- “无” storm_drain_type 或 rain_source 可能反映数据缺口,而不是物理缺失。

资源下载
下载价格9.9 元
VIP免费
立即购买
