分享(三)丨建筑物提取数据集

  • A+
所属分类:遥感测绘
广告也精彩

图片来源于网络建筑物是人类社会生产、生活的主要载体,建筑物轮廓信息是国家基础地理信息的重要组成部分。相比于人工遥感解译与矢量化,结合算法模型从遥感影像中自动提取建筑物轮廓大大减少了人力物力的消耗。这在城市扩张研究、数字城市建设等领域有着广泛的应用。近年来,全卷积神经网络的不断发展为高精度自动化建筑物提取提供了新的方法。但是,由于建筑物在尺度,建筑风格,形态上有较大差异,目前高精度建筑物提取仍存在较大挑战。一方面,难兼顾较好的建筑物定位精度(依赖于高层语义特征)与建筑物边缘精度(依赖于浅层特征)。另一方面,基于神经网络的方法往往依赖于大尺度数据集进行训练。图片来源于网络因此,我们总结了现有10个建筑物数据集的基本情况,并附上下载链接,供大家进行模型训练,验证与测试。本期分享的建筑物数据集如下:1. Massachusetts 建筑物数据集2. SpaceNet Challenge数据集3. 航空影像目标识别数据集4. Inria数据集5. USSOCOM 城市三维挑战数据集6. DeepGlobe Challenge建筑物数据集7. CrowdAI Mapping Challenge数据集8. WHU 建筑物数据集9. AIRS数据集10. Open AI 坦桑尼亚建筑物数据集分享(三)丨建筑物提取数据集Massachusetts 建筑物数据集Massachusetts建筑数据集是一个用于建筑物分割的大型数据集。该数据集由151组航拍图像和相应的单通道标签图像组成,其中训练部分为137组,测试部分为10组,验证部分为4组。数据集中所有图像的大小为1500×1500,分辨率为1 m。每幅影像覆盖了2.25 km2的区域,整个数据集大约覆盖340 km2。建筑物标签来自OpenStreetMaps。分享(三)丨建筑物提取数据集图1 遥感影像(左图)和标签(右图)下载地址:https://www.cs.toronto.edu/~vmnih/data/参考文献:Mnih V. Machine learning for aerial image labeling[D]. University of Toronto (Canada), 2013.分享(三)丨建筑物提取数据集SpaceNet Challenge数据集Spacenet数据集是2018年SpaceNet Challenge发布的数据集,该数据集包含了里约热内卢、维加斯、巴黎、上海、喀土穆、亚特兰大6个地区的高分辨率遥感影像及其对应的建筑物轮廓。其中,里约热内卢及亚特兰大采用的是DigitalGlobe的WorldView-2卫星上采集的30 cm图像,而维加斯、巴黎、上海、喀土穆则采用的是WorldView-3卫星上采集的30 cm图像。6个地区含有合计68.5万栋建筑物。分享(三)丨建筑物提取数据集图2 数据集各区域数据概览分享(三)丨建筑物提取数据集图3 影像示例下载地址:https://spacenetchallenge.github.io/分享(三)丨建筑物提取数据集航空影像目标识别数据集对于航空图像分析过程的自动化需要大量训练数据用于机器学习算法的开发需求,航空影像目标识别数据集提供了横跨9个美国城市25个地点的高分辨率航空图像及4万多个建筑轮廓及地形高度数据(激光雷达)。除了建筑物轮廓,这个数据集还包含了道路矢量。建筑物和道路形状文件来自OpenStreetMaps(OSM);激光雷达数据来自美国国家海洋和大气管理局(NOAA)及德克萨斯州自然资源信息系统(TNRIS)。该数据集适用于训练计算机视觉和机器学习算法,用于遥感影像目标识别和分割,特别是建筑物检测、道路提取及建筑物高度估计。图4 数据示例下载地址:https://figshare.com/collections/Aerial_imagery_object_identification_dataset_for_building_and_road_detection_and_building_height_estimation/3290519参考文献:Bradbury, Kyle; Brigman, Benjamin; Collins, Leslie; Johnson, Timothy; Lin, Sebastian; Newell, Richard; et al. (2016): Aerial imagery object identification dataset for building and road detection, and building height estimation. figshare. Collection.分享(三)丨建筑物提取数据集Inria数据集Inria数据集包含覆盖面积810 km2(405 km2用于训练,405 km2用于测试)的空间分辨率为0.3 m的航空正射彩色图像及影像对应的二值化建筑物轮廓。数据集只公开了训练集的建筑物标签,而测试集则只提供影像。这些影像覆盖了不同的城市聚落,从人口稠密的地区(如旧金山的金融区)到阿尔卑斯山区的城镇(如奥地利蒂罗尔的莱恩兹)。与传统的将相同图像的相邻部分分割为训练和测试子集不同,Inria数据集的训练集与测试集还分别包括了不同区域的影像,相同区域不同成像时间的影像。例如,芝加哥上空的图像包含在训练集中(不在测试集中),旧金山上空的图像包含在测试集中(不在训练集中)。该数据集的最终目标是评估设计的模型的泛化能力:虽然相同地区的图像可用于训练,但该设计的模型应该在不同照明条件、城市景观和一年中的不同时间上,也能够实现精度较高的建筑物提取。分享(三)丨建筑物提取数据集图5 Inria数据示例下载地址:https://project.inria.fr/aerialimagelabeling/参考文献:Maggiori E, Tarabalka Y, Charpiat G, et al. Can semantic labeling methods generalize to any city? The INRIA aerial image labeling benchmark[C]//IEEE International Symposium on Geoscience and Remote Sensing (IGARSS). 2017.分享(三)丨建筑物提取数据集USSOCOM 城市三维挑战数据集基于卫星图像精确提取建筑物是制作精确三维模型和地图的首要和最具挑战性的步骤之一。虽然自动化算法不断改进,但仍需要大量的手动操作来确保地理空间的精度。基于此,USSOCOM 城市三维挑战旨在寻找一个机器学习算法,能够仅基于正射彩色卫星图像和三维高度数据提供可靠的建筑物自动标记。挑战公布了一个大规模的数据集,其中包括RGB影像,三维数字表面模型和三维数字高程模型,这些模型是由商业卫星图像生成的,覆盖了超过360 km2的区域,包含约15.7万个建筑物矢量。所有图像产品均以50 cm作为地面采样距离。分享(三)丨建筑物提取数据集图6遥感影像(左图)、三维高度数据(中图)、标签(右图)下载地址:https://www.topcoder.com/urban3dhttps://spacenetchallenge.github.io/datasets/Urban_3D_Challenge_summary.htmlhttps://github.com/topcoderinc/Urban3d参考文献:H. Goldberg, M. Brown, and S. Wang, A Benchmark for Building Footprint Classification Using Orthorectified RGB Imagery and Digital Surface Models from Commercial Satellites, 46th Annual IEEE Applied Imagery Pattern Recognition Workshop, Washington, D.C, 2017.H. Goldberg, S. Wang, M. Brown, and G. Christie. Urban 3D Challenge: Building Footprint Detection Using Orthorectified Imagery and Digital Surface Models from Commercial Satellites. In Proceedings SPIE Defense and Commercial Sensing: Geospatial Informatics and Motion Imagery Analytics VIII, Orlando, Florida, USA, 2018.分享(三)丨建筑物提取数据集DeepGlobe Challenge建筑物数据集2018年CVPR发布了DeepGlobe Challenge比赛,包括建筑物识别、道路提取及土地利用分类3个赛道。其中,建筑物识别及提取赛道发布了DeepGlobe Building Extraction数据集。数据集包括4个地区:拉斯维加斯、巴黎、上海和喀土穆。标记的数据集由240586幅200 m×200 m(对应650×650像素)的非重叠影像,及3020701栋建筑物轮廓组成。这些地区覆盖了不同的城市区域及乡村区域。影像来自WorldView-3传感器,具有31 cm单波段全色影像及8波段1.24 m多光谱图像。分享(三)丨建筑物提取数据集图7 DeepGlobe Challenge建筑物数据集示例下载地址:http://deepglobe.org/index.htmlhttps://competitions.codalab.org/competitions/18544参考文献:Demir I, Koperski K, Lindenbaum D, et al. DeepGlobe 2018: A Challenge to Parse the Earth through Satellite Images[J]. arXiv preprint arXiv:1805.06561, 2018.分享(三)丨建筑物提取数据集CrowdAI Mapping Challenge数据集在CrowdAI Mapping挑战中,提供了RGB图像的卫星图像的各个分幅的数据集,以及它们对图像所在位置的相应建筑物轮廓。训练集是一套包含280741幅卫星图像(300x300像素RGB图像),以及它们在MS-COCO格式中的相应注释的数据集。测试集是一套包含60317幅卫星图像(300x300像素RGB图像),以及MS-COCO格式的相应注释的数据集。测试集提供了60697幅卫星图像(300x300像素RGB图像),参赛需要为测试集影像预测出建筑物标注并提交。分享(三)丨建筑物提取数据集图8 CrowdAI Mapping Challenge数据集示例下载地址:https://www.crowdai.org/challenges/mapping-challenge分享(三)丨建筑物提取数据集WHU 建筑物数据集WHU 建筑物数据集由航空数据集和卫星数据集组成。航空影像数据集航空影像数据来自新西兰土地信息服务网站,地面分辨率降采样为0.3 m,选取的克赖斯特彻奇内大约有2.2万栋独立建筑。数据集提供了建筑物的shapefile格式数据及栅格化数据。区域内影像被裁剪成8189块512×512像素的图像,并将样本分为3个部分:一个训练集(4736幅),一个验证集(1036幅)和一个测试集(2416幅)。分享(三)丨建筑物提取数据集图9 航空影像数据集示例全球城市卫星数据集全球城市卫星数据集的影像包含来自世界各地的城市的各种遥感资源,包括QuickBird, Worldview series, IKONOS, ZY-3等。数据集还包括了所有建筑物的轮廓数据。它包含204张图片(512×512像素,分辨率从0.3 m到2.5 m不等)。除了卫星传感器的差异,大气条件的变化、全色和多光谱融合算法不同以及大气辐射校正不同使得在测试建筑物提取算法的鲁棒性上具有较大挑战性。分享(三)丨建筑物提取数据集图10 全球城市卫星数据集示例东亚卫星数据集东亚卫星数据集由6幅邻近的卫星图像组成,覆盖东亚550 km2,地面分辨率为2.7 m。该测试区域主要用于评估和开发深度学习方法在相同地理区域内不同数据源但建筑风格相似的情况下的泛化能力。矢量建筑地图总共包含29085栋建筑。整个图像被无缝地裁剪到17388块512×512的小块中,以便于训练和测试。其中,13662幅用于训练,3726幅用于测试。分享(三)丨建筑物提取数据集图11 东亚卫星数据集示例建筑物变化检测数据集建筑物变化检测数据集覆盖了2011年2月发生6.3级地震并在随后几年重建的地区。该数据集由2012年4月获得的航拍图像组成,包含面积为20.5 km2的12796栋建筑(2016年数据集中同一区域的16077栋建筑)。通过在地面上手动选择30个GCPs,将子数据集进行地理校正,得到了1.6像素精度的航空数据集。分享(三)丨建筑物提取数据集图12 建筑物变化检测数据集示例下载地址:http://study.rsgis.whu.edu.cn/pages/download/参考文献:Ji S, Wei S, Lu M. Fully Convolutional Networks for Multisource Building Extraction From an Open Aerial and Satellite Imagery Data Set[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018 (99): 1-13.分享(三)丨建筑物提取数据集AIRS数据集AIRS,航空图像屋顶分割数据集,是一个公开数据集,其目的是从非常高分辨率的航空图像中分割屋顶算法的基准。AIRS的主要特点可以概括为:覆盖范围457 km2正射航空影像,总计超过22万栋建筑物。极高的图像空间分辨率(0.075 m)。与屋顶轮廓严格对齐的屋顶轮廓标签。AIRS数据集几乎覆盖了新西兰南岛最大城市克赖斯特彻奇的全部地区。照片拍摄于2015年和2016年的飞行季节,所提供的图像是新西兰横轴墨卡托投影的RGB通道和7.5 cm分辨率的正射校正DOMs。AIRS提出的分割任务包含两个类:屋顶像素和非屋顶像素。分享(三)丨建筑物提取数据集图13 AIRS数据影像及标签示例下载地址:https://www.airs-dataset.com/参考文献:Chen Q, Wang L, Wu Y, et al. Aerial Imagery for Roof Segmentation: A Large-Scale Dataset towards Automatic Mapping of Buildings[J]. arXiv preprint arXiv:1807.09532, 2018.Chen Q, Wang L, Wu Y, et al. Aerial imagery for roof segmentation: A large-scale dataset towards automatic mapping of buildings[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 147: 42-55.分享(三)丨建筑物提取数据集Open AI 坦桑尼亚建筑物数据集Open AI坦桑尼亚邀请数据科学家开发特征检测算法,利用坦桑尼亚无人机飞行员通过桑给巴尔测绘计划(ZMI)收集的高分辨率航空图像,自动识别建筑物和建筑物类型。这项挑战的目标是在建筑的不同阶段对建筑足迹进行正确的分割和分类。Open AI 坦桑尼亚建筑物数据集以GeoTIFF文件和GeoJSON文件的形式提供,GeoJSON文件包含建筑物轮廓。geojson文件中的“condition”属性描述建筑的类别,属性中的任何其他字段都可以忽略。分享(三)丨建筑物提取数据集图14Open AI 坦桑尼亚建筑物数据示例下载地址:https://competitions.codalab.org/competitions/20100特别鸣谢:本期微推资料由公众号IMARS遥感大数据智能挖掘与分析提供,联合《遥感学报》微信公众号共同推出。申明:本期发布的网站内容均不代表本号观点,本号旨在提供参考素材以便学习交流。往 期 推 荐资源共享第三弹,统计资料精粹资源分享第二弹,数据资料大荟萃资源分享第一弹:在哪都能好好学分享(一)高光谱遥感数据集分享(二)LiDAR点云数据水资源遥感论文集萃分享(三)丨建筑物提取数据集编辑:薇薇审校:雪儿指导:梧桐君声明欢迎转载、转发本号原创内容,转载信息请与本号联系授权,标注原作者和信息来源为《遥感学报》。本号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分资料来源于网络,如涉及作品文字、图片等内容、版权和其他问题请在20日内与本号联系,我们将在第一时间处理。《遥感学报》拥有最终解释权。微信加群为便于学术交流,提供优质服务,《遥感学报》建立了微信群。需要加群的小伙伴,请加小编个人微信入群,并备注:姓名+单位。营销广告者勿扰。微推转载、合作联系:E-mail:jrs@radi.ac.cn 或 微信后台留言。分享(三)丨建筑物提取数据集投稿网站:http://www.jors.cn分享(三)丨建筑物提取数据集分享(三)丨建筑物提取数据集好看就点这里哦分享(三)丨建筑物提取数据集
点击查看详情

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
广告也精彩
avatar

发表评论

您必须登录才能发表评论!