我想告诉你关于点云（Point Cloud）的一切

最新推荐文章于 2026-04-09 14:46:54 发布

原创最新推荐文章于 2026-04-09 14:46:54 发布 · 4.4k 阅读

38 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#笔记 #学习 #点云 #激光雷达 #计算机视觉

点云（Point Cloud）

点云（Point Cloud）是三维空间中大量离散点的集合，每个点都有空间坐标（通常是 x, y, z）和可选的属性（如颜色、强度、法向量等）。它是描述物体或场景几何形状的一种基础数据形式。

1. 点云的组成

点（Point）：三维空间中的一个位置，通常表示为 (x, y, z)。
属性（Attribute，可选）：
- 颜色（RGB）
- 反射强度（Intensity）
- 法向量（Normal Vector）

例如，一个扫描的建筑物表面，点云可以包含每个墙面和屋顶上的数百万个点。
在这里插入图片描述

2. 点云与网格（Mesh）的关系

特性	点云	网格（Mesh）
数据类型	离散点集合	顶点 + 边 + 面
表示方式	只包含点的空间位置	点通过边和面连接形成连续表面
用途	3D 扫描、激光雷达、测量	3D 建模、动画、渲染
优点	精确捕捉真实世界的表面	易于渲染、处理和模拟物理属性
缺点	不连续，需要后处理生成网格	构建过程可能复杂，受网格密度限制

简单来说，点云是“原始的空间数据”，网格是“加工后的可视化模型”。
![[Pasted image 20251010153831.png|500]]

3. 点云的来源

激光扫描（LiDAR）
深度相机（如 Kinect、RealSense）
结构光扫描
多视角摄影测量（Photogrammetry）

4. 点云在计算机视觉中的角色

点云属于计算机视觉（Computer Vision, CV）的知识框架，但更具体地说，它是 “三维计算机视觉（3D Computer Vision） ” 的核心数据载体 —— 传统计算机视觉以二维图像（RGB、灰度图）为主要输入，而三维计算机视觉则聚焦于 “从数据中恢复 / 处理三维空间信息”，点云正是这类数据中最直接、最常用的形式之一。

从知识层次来看，点云在计算机视觉中的定位可分为 “基础数据层→预处理层→特征提取层→高层任务层” 四个递进层次，每个层次对应不同的技术目标和核心方法。以下是详细的框架梳理：

一、点云在计算机视觉中的定位：三维视觉的 “核心数据入口”

首先需要明确：计算机视觉的本质是 “让机器理解视觉信息中的空间、物体、语义关系”，而 “空间信息” 的维度是关键区分 ——

二维 CV：基于平面图像（仅包含 “宽度 × 高度” 的像素信息，深度需通过算法间接推断，如双目视觉的视差匹配）；
三维 CV：直接处理 “宽度 × 高度 × 深度” 的三维空间数据，点云、深度图（Depth Map）、网格（Mesh）是主要数据形式，其中点云是 “最原始、最灵活” 的三维数据（可轻松转化为深度图或网格，反之则需丢失信息）。

因此，点云不是孤立的技术，而是三维计算机视觉中 “连接原始传感器数据与高层任务” 的核心桥梁，贯穿从数据获取到应用落地的全流程。
在这里插入图片描述

二、点云的计算机视觉知识框架（四层结构）

第一层：基础数据层 —— 点云的 “来源与本质”

核心目标：理解点云的 “数据属性” 和 “获取方式”，是后续所有处理的前提。

这一层回答两个问题：“点云从哪来？”“点云是什么样的？”

核心内容	关键细节
1. 点云的数据源	- 激光雷达（LiDAR）：最主流来源（如车载 LiDAR、机载 LiDAR），直接输出三维坐标 + 反射强度； - 深度相机：通过结构光（如 iPhone Face ID）、飞行时间（ToF）生成深度图，再转化为点云； - 图像重建：通过多视角图像（如双目相机、运动恢复结构 SfM）间接计算点云（精度低于 LiDAR）。
2. 点云的核心属性	- 几何属性：每个点的三维坐标（X,Y,Z），决定空间位置； - 附加属性：反射强度（LiDAR 特有，反映目标表面材质）、颜色（若与 RGB 相机融合，可赋予点云颜色信息）； - 结构特征：稀疏 / 密集（如车载 LiDAR 点云稀疏，结构光点云密集）、有序 / 无序（图像转化的点云有序，LiDAR 点云通常无序）。
3. 点云与其他数据的对比	- 与图像：图像是 “像素网格（有序）”，点云是 “离散点集（无序）”； - 与网格：网格是 “面元拼接的连续表面”，点云是 “离散点”（网格需由点云重建生成，丢失部分原始细节）。

第二层：预处理层 —— 点云的 “数据清洗与标准化”

核心目标：解决点云的 “原始缺陷”，为后续处理提供高质量数据（类似图像的去噪、resize）。

原始点云常存在噪声、稀疏不均、坐标系不统一等问题，需通过以下操作优化：

预处理任务	核心目的	常用方法
1. 去噪与离群点剔除	去除传感器误差（如 LiDAR 的随机噪声）或环境干扰（如空中漂浮的尘埃点）	- 统计滤波（基于邻域点距离的标准差剔除异常点）； - 半径滤波（剔除邻域点数少于阈值的孤立点）。
2. 下采样（降采样）	减少点云数量，降低计算成本（避免后续任务算力过载），同时保留核心结构	- 体素网格下采样（将空间划分为小体素，每个体素保留一个代表点）； - 随机下采样（简单但可能丢失细节，仅用于快速降维）。
3. 点云配准（Registration）	将多帧 / 多视角点云（如不同时刻的车载 LiDAR 点云、不同角度的零件扫描点云）统一到同一坐标系	- 粗配准：如 ICP（迭代最近点，适用于初始位置接近的情况）； - 精配准：如 NDT（正态分布变换，适用于初始位置差异大的场景）； - 特征匹配配准：结合 SIFT/SURF 等特征点实现鲁棒配准。
4. 分割（初步）	分离 “感兴趣区域” 与背景（如从场景点云中分离出地面，减少后续任务干扰）	- 地面分割：如 RANSAC 算法（拟合平面模型，区分地面与非地面点）； - 区域生长分割（基于点的距离 / 法向量相似性聚类）。

第三层：特征提取层 —— 点云的 “信息抽象与表征”

核心目标：从点云的 “几何属性” 中提取 “可用于后续任务的特征”（类似图像的边缘、纹理特征）。

由于点云是 “无序离散点集”，无法直接复用图像的卷积操作，因此需要专门的特征提取方法：

特征类型	核心思路	典型方法
1. 手工设计特征（传统方法）	基于点的局部 / 全局几何关系，人工定义特征描述子	- 局部特征：・FPFH（快速点特征直方图，描述点的邻域法向量分布）；・SHOT（签名直方图，基于多尺度邻域的几何统计）； - 全局特征：・VFH（视角特征直方图，描述整个点云的全局形状）；・欧拉数、体积、表面积（简单几何统计特征）。
2. 深度学习特征（当前主流）	通过神经网络自动学习点云的高阶特征，解决手工特征泛化能力差的问题	- 点级网络：如 PointNet（首个直接处理无序点云的网络，通过对称函数解决无序性）、PointNet++（引入分层采样，捕捉局部细节）； - 体素级网络：如 VoxelNet（将点云转化为体素，用 3D 卷积提取特征，适用于目标检测）； - 点 - 体素融合网络：如 PV-RCNN（结合点级和体素级特征，平衡精度与效率）。

第四层：高层任务层 —— 点云的 “实际应用落地”

核心目标：基于预处理后的点云和提取的特征，完成计算机视觉的典型任务（与二维 CV 的任务对应，但更侧重三维信息）。这一层是点云技术的最终价值体现：

高层任务	任务定义	典型应用场景	核心方法 / 模型
1. 三维目标检测	从点云中识别出特定类别物体（如车辆、行人、树木），并预测其 3D bounding box（位置、尺寸、朝向）	- 自动驾驶：检测前方车辆、行人、障碍物； - 工业质检：检测流水线上的零件是否存在； - 机器人抓取：识别待抓取的物体。	- 传统方法：基于 FPFH/SHOT 特征 + SVM / 随机森林分类； - 深度学习方法：VoxelNet、PointPillars（将点云投影为 “柱体”，用 2D 卷积加速）、CenterPoint（基于关键点检测物体中心）。
2. 点云分割	将点云按 “语义类别”（如道路、建筑、植被）或 “实例”（如单个车辆、单个行人）划分为不同子集	- 自动驾驶：语义分割（区分道路、人行道、护栏）； - 城市建模：实例分割（分离不同建筑、树木）； - 医疗影像：分割 CT/MRI 生成的点云中的器官（如肝脏、肿瘤）。	- 语义分割：PointNet++（分层分割）、SqueezeSeg（将点云投影为图像，用 2D 分割网络）； - 实例分割：PointRCNN（先检测再分割）、Mask3D（直接生成实例掩码）。
3. 三维重建	将点云转化为 “连续的三维模型”（如网格、曲面），还原目标的完整形态	- 文化遗产保护：重建古建筑、文物的三维模型； - 工业设计：逆向工程（从零件扫描点云重建 CAD 模型）； - 虚拟现实（VR）：构建虚拟场景的三维模型。	- 表面重建：泊松重建（生成光滑曲面）、Alpha Shapes（保留尖锐边缘）； - 网格优化：去除冗余面元、修复漏洞，生成高质量网格模型。
4. SLAM（同步定位与地图构建）	机器人 / 设备在未知环境中，同时实现 “自身定位” 和 “构建环境地图”（点云地图）	- 自动驾驶：构建高精地图（HD Map）； - 机器人导航：室内机器人（如扫地机器人）的自主定位与避障； - 无人机勘探：在未知区域构建地形地图。	- 激光 SLAM：如 LOAM（激光里程计与地图构建）、LeGO-LOAM（优化版，适用于地面机器人）； - 融合 SLAM：结合 LiDAR 点云和相机图像（如 ORB-SLAM3），提升鲁棒性。
5. 其他任务	基于点云的特定场景需求	- 距离 / 尺寸测量（工业零件的尺寸检测）； - 物体姿态估计（机器人抓取时判断物体朝向）； - 动态目标追踪（自动驾驶中追踪前方移动车辆）。	- 尺寸测量：基于点云的欧氏距离计算； - 姿态估计：基于 3D 目标检测的 bounding box 朝向预测； - 动态追踪：卡尔曼滤波 + 点云匹配。

三、总结：点云在计算机视觉中的 “层级角色”

点云是三维计算机视觉从 “数据输入” 到 “应用落地” 的核心链条，其层级关系可概括为：

基础数据层（获取点云）→ 预处理层（优化点云）→ 特征提取层（抽象信息）→ 高层任务层（落地应用）

这个框架与二维计算机视觉的 “图像获取→图像预处理→特征提取→图像分类 / 检测” 逻辑一致，但因点云的 “三维性、无序性”，每个层级的技术方法都有其特殊性 —— 这也正是 “三维计算机视觉” 作为计算机视觉重要分支的核心原因。

5. 点云与法向量的关系

在这里插入图片描述

点云和法向量是三维几何处理中紧密相关的两个概念，它们的关系可以从以下几个方面理解：

定义上的关联
- 点云（Point Cloud）是三维空间中离散点的集合，每个点通常用三维坐标 (x, y, z) 表示，是对物体表面的采样结果。
- 法向量（Normal Vector）是垂直于物体表面的向量，对于点云中的每个点，其法向量描述了该点所在局部表面的朝向。
法向量的来源

法向量并非点云固有的属性，而是通过点云的几何结构计算得到的：
- 对于点云中的某个点，通常会寻找其周围的邻近点（如 K 近邻），这些点共同构成一个局部平面或曲面。
- 通过拟合这个局部曲面（如最小二乘法拟合平面），可以计算出该平面的法向量，作为该点的法向量。
相互作用
- 点云是计算法向量的基础，没有点云的空间分布信息，无法确定法向量。
- 法向量反过来增强了点云的几何表达能力：点云仅描述位置，而法向量补充了表面朝向，两者结合能更完整地反映物体表面的局部几何特征（如凹凸性、曲率等）。
应用中的配合

在三维重建、分割、配准等任务中，法向量常与点云结合使用。例如：
- 曲面重建时，法向量指导如何平滑连接离散点；
- 物体分割时，法向量的突变可用于识别表面的边界。