关于数据集

语境

卫星图像为农业、国防情报、能源和金融等各个市场提供了独特的洞察。Planet 等新兴商业图像提供商正在利用小型卫星群每天捕捉整个地球的图像。

大量新图像的出现超出了组织手动查看每张捕获图像的能力,因此需要机器学习和计算机视觉算法来帮助自动化分析过程。

该数据集旨在帮助解决在卫星图像中检测大型船舶位置的难题。自动化该过程可应用于许多问题,包括监控港口活动水平和供应链分析。

内容

该数据集由 Planet 卫星影像(采集自加利福尼亚州旧金山湾和圣佩德罗湾地区)提取而成。它包含 4000 张 80×80 RGB 图像,并标有“船舶”或“非船舶”类别。图像源自 PlanetScope 全画幅视觉场景产品,已正射校正至 3 米像素大小。

提供一个压缩目录shipsnet.zip,其中包含以 .png 格式保存的整个数据集。每个图像的文件名遵循特定格式:{label} _ {scene id} _ {longitude} _ {latitude}.png

  • 标签:值为 1 或 0,分别代表“船舶”类和“非船舶”类。
  • 场景 ID:提取图像的 PlanetScope 视觉场景的唯一标识符。场景 ID 可与Planet API一起使用,以发现并下载整个场景。
  • longitude_latitude:图像中心点的经度和纬度坐标,值之间用单个下划线分隔。

数据集也以 JSON 格式的文本文件形式分发shipsnet.json。加载的对象包含数据标签场景 ID位置列表。

每个 80×80 RGB 图像的像素值数据都以 19200 个整数的列表形式存储在数据列表中。前 6400 个条目包含红色通道值,接下来的 6400 个条目包含绿色通道值,最后 6400 个条目包含蓝色通道值。图像按行优先顺序存储,因此数组的前 80 个条目是图像第一行的红色通道值。

标签场景 ID位置中索引i处的列表值分别对应于数据列表中的第 i个图像。

类标签

“船舶”类别包含 1000 张图像。此类图像以一艘船的船身为中心,包含不同大小、方向和大气采集条件的船舶。此类图像的示例如下所示。

“无船舶”类别包含 3000 张图像。其中三分之一是随机抽样的不同地表覆盖特征(水、植被、裸地、建筑物等),不包含任何船舶部分。接下来的三分之一是“部分船舶”,仅包含船舶的一部分,但不足以满足“船舶”类别的完整定义。最后三分之一是之前被机器学习模型错误标记的图像,通常是由亮像素或强线性特征造成的。此类图像的示例如下所示。

场景

该目录中包含八张全场景图像scenes。场景可用于可视化基于数据集训练的分类模型的性能。通过将模型应用于整个场景并查看“船舶”分类出现的位置来验证模型的准确性——场景提供的上下文有助于确定正确结果和误报。示例场景如下所示。

致谢

用于构建此数据集的卫星图像可通过 Planet 的Open California数据集获取,该数据集已获得开放许可。因此,此数据集也遵循相同的 CC-BY-SA 许可。用户可以注册免费的 Planet 帐户来搜索、查看和下载图像,并访问其 API。

资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?