Building3D An Urban-Scale Dataset and Benchmarks 论文阅读

Building3D An Urban-Scale Dataset and Benchmarks 论文阅读

2024-05-14 20:12

本文主要是介绍Building3D An Urban-Scale Dataset and Benchmarks 论文阅读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章主页

Building3D
在这里插入图片描述

任务

提出了一个城市规模的数据集,由超过 16 万座建筑物以及相应的点云、网格和线框模型组成,覆盖爱沙尼亚的 16 个城市,面积约 998 平方公里。

动机

现有的3D建模数据集主要集中在家具或汽车等常见物体上。缺乏建筑数据集已成为将深度学习技术应用于城市建模等特定领域的主要障碍。

要点

数据集包含原始点云,建筑物点云,屋顶点云,以及网格模型和线框模型。

贡献

Building3D 是第一个也是最大的城市规模建筑建模基准,可以对监督学习方法和自监督学习方法进行比较。

相关工作

只考虑相关的 3D 建模数据集,重点关注基于点云的城市建模数据集。

  • ShapeNet 是目前最流行的用于零件分割、点云补全和重建的 3D 对象数据集之一。
  • RoofN3D 是为 3D 建筑重建而设计的。
  • City3D 是一个大规模建筑重建数据集,由约2万个建筑网格模型和航空LiDAR点云组成。
  • UrbanScene3D 涵盖 10 个合成场景和 6 个真实世界场景。

方法

  • 建筑物点云 原始LiDAR点云由高精度RIEGL VQ-1560i扫描仪在海拔2600米处收集,然后以LAZ格式存储。点云的相对精度为20毫米。点云密度为每平方米30.314点,点到点距离为0.1816m。对于 3D 建筑物重建,删除不相关的点云,仅保留建筑物点云。每个建筑物点云均以 XYZ 格式存储,包括 XYZ 坐标、RGB 颜色、近红外信息、强度和反射率。
  • 屋顶点云 删除所有代表立面的点。基本上,几乎所有立面都垂直于 XY 平面。计算每个网格面的法线,并删除所有法线与 XY 平面平行的网格面,以生成屋顶网格模型。如果一个点到屋顶网格模型的距离在给定阈值内,则该点被分类为屋顶。
  • 网格模型 建筑网格模型是通过使用 Terrasolid 软件进行手动编辑,根据航空 LiDAR 点云和建筑足迹创建的。这些网格模型是典型的 LoD2 模型,包括详细且真实的屋顶表示。
  • 线框模型 计算每个网格的法线。如果两个相邻三角形网格的法线近似平行,则表明它们共面,共享边将被移除。删除所有共享边后,获得具有冗余顶点的粗线框模型。粗线框模型还包含可以合并为长边的短边。最后,通过去除所有冗余顶点并合并短边生成精细线框模型,然后由专业技术人员审核和调整。

实验

评估指标
平均角偏移 (ACO)、精度、召回率和 F1 分数、3D 网格 IoU 和均方根误差 (RMSE)。
ACO 是预测角点和真实角点之间的平均偏移量。
通过混淆矩阵计算角点精度(CP)、边缘精度(EP)、角点召回率(CR)和边缘召回率(ER),以评估角点和边缘分类的准确性。

本文提出了一种自监督方法和一种无监督方法,与现在常用的点云神经网络提取特征点做基准测试,实验结果见论文原文第4章。

应用

  • 构建语义和部分分割
  • 网格简化
  • 足迹检测
  • 空中路径规划

这篇关于Building3D An Urban-Scale Dataset and Benchmarks 论文阅读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/989735

相关文章

经典文献阅读之--U-BEV(基于高度感知的鸟瞰图分割和神经地图的重定位)

0. 简介 高效的重定位对于GPS信号不佳或基于传感器的定位失败的智能车辆至关重要。最近,Bird’s-Eye-View (BEV) 分割的进展使得能够准确地估计局部场景的外观,从而有利于车辆的重定位。然而,BEV方法的一个缺点是利用几何约束需要大量的计算。本文《U-BEV: Height-aware Bird’s-Eye-View Segmentation and Neural Map-bas

论文解读:Self-Prompt Mechanism for Few-Shot Image Recognition

文章汇总 存在的问题 由于提示文本和图像特征之间固有的模态差异,常规的提示方法的性能受到限制。 动机 让视觉信息自己给自己提示 解决办法 SPM涉及到图像编码器跨空间和通道维度产生的固有语义特征的系统选择,从而产生自提示信息。随后,在将这种自提示信息反向传播到神经网络的更深层后,它有效地引导网络学习和适应新样本。 流程解读 作者的想法很简单,常规的方法都是用文本来指导Image E

pdf阅读器哪个好用?4款高效阅读软件推荐

pdf阅读器哪个好用?在数字化时代的浪潮中,PDF文档凭借其卓越的跨平台兼容性、便捷的传输方式以及保持格式一致的稳定性,已经成为我们日常工作与学习的得力助手。在这样的背景下,选择一款功能强大、操作便捷的PDF阅读器,不仅能显著提高我们处理PDF文件的工作效率,更能带来流畅、舒适的阅读体验。下面,就为大家推荐几款值得一试的PDF阅读器。 软件一:嗨动PDF转换器(PC) ①简洁易用的界面设计:界

TNNLS:Fast Self-Supervised Clustering With Anchor Graph论文阅读

1 Abstract 由于避免了使用通常在现实世界中不足的标记样本,无监督学习被视为在聚类任务中的快速和强大策略。然而,直接从原始数据集进行聚类会导致高计算成本,这限制了其在大规模和高维问题上的应用。最近,基于锚点的理论被提出来部分缓解这个问题,并自然地稀疏化了亲和力矩阵,但仍然存在挑战,即在保持高效性的同时获得出色的性能。为了解决这个问题,我们首先提出了一个快速的半监督框架(FSSF),结合了

Big Bird: Transformers for Longer Sequences论文详解

文章目录 Big Bird大鸟模型论文要解决问题解决方法随机注意力固定窗口注意力全局注意力复杂度分析 实验三种注意力的消融实验。语言模型对比roberta、longformerQA问题中对比longformer长文本分类任务文章摘要任务基因语言模型实验 如有问题欢迎指出,参考论文https://arxiv.org/abs/2007.14062 Big Bird大鸟模型 论文要解决

2024深圳杯数学建模C题参考论文24页+完整代码数据解题

一、问题研究 24页参考论文: 【编译器识别】2024深圳杯C题24页参考论文+1-3小问完整解题代码https://www.jdmm.cc/file/2710545/ 为了回答这些问题,我们需要进行一系列的编译实验、分析编译结果,并构建判别函数。以下是对这些问题的初步分析和可能的方法: 问题1:编译并对比结果 1.获取不同版本的GCC编译器:首先,需要确保安装了不同版本的GCC编译

CV每日论文--2024.5.10

1、Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models 中文标题:扩散模型的注意力驱动的训练免费效率增强 简介:扩散模型在生成高质量和多样化图像方面取得了出色的表现,但其卓越性能是以昂贵的架构设计为代价的,特别是广泛使用注意力模块。现有的工作主要通过重新训练的方式来提高扩散模型的效率,但这种

Effective 阅读总结

一丶对象的创建和销毁 (一) 静态工厂方法替代构造器 1.静态工厂方法的几大优势: (1) 静态工厂方法与传统构造器方法不同的第一大优势 ,他们有名称: sample:返回一个素数 public static int BigInteger.probablePrime(int, int, Random){} (2)不必再每次调用它的时候都创建一个新的对象: sample:重复利用 预先创建好的实例

STM: SpatioTemporal and Motion Encoding for Action Recognition 论文阅读

STM: SpatioTemporal and Motion Encoding for Action Recognition 论文阅读 Abstract1. Introduction2. Related Works3. Approach3.1. Channel-wise SpatioTemporal Module3.2. Channel-wise Motion Module3.3. STM

【论文笔记】CNN2GNN: How to Bridge CNN with GNN

Abstract CNN在视觉任务上表现优异,通常堆叠大量卷积核来提高训练表现; GNN成功用几个图神经层探索了图数据之间的潜在拓扑关系。 由于缺乏图结构,在非图数据上无法使用GNN,在大规模场景下推理延迟较高。 提出问题:如何桥接这两个异构网络? 本文提出了一个新颖的CNN2GNN框架,通过蒸馏将CNN和GNN统一在一起。 设计可微稀疏图学习模块(differentiable sparse