3D Gaussian Splatting 赋能智驾仿真：从场景重建到端到端训练的技术全景¶

UE5 技术交流群

加入 UE5 技术交流群¶

如果您对虚幻引擎5的图形渲染技术感兴趣，欢迎加入我们的 UE5 技术交流群！

扫描上方二维码添加个人微信 wlxklyh，备注"UE5技术交流"，我会拉您进群。

在技术交流群中，您可以：

与其他UE开发者交流渲染技术经验
获取最新的GDC技术分享和解读
讨论图形编程、性能优化、构建工具流、动画系统等话题
分享引擎架构、基建工具等项目经验和技术难题

源视频信息 - 标题: [UFSH2025]新一代场景扫描与重建技术赋能智能辅助驾驶仿真 | 张维维鲍世强 - 时长: 42分钟 - 视频链接: https://www.bilibili.com/video/BV1W5mzBAEw3 - 说明: 本文由 AI 基于视频内容生成，结合技术深度解析进行了扩展

导读 - 空间智能技术正在重塑自动驾驶仿真领域，3D Gaussian Splatting 以其低成本、高真实感的特性成为新一代场景重建的核心技术 - 混合仿真引擎架构将 3D Gaussian 的静态场景与 UE5 的动态资产相结合，实现了**成本与质量的最优平衡** - 从数据采集到算法训练的端到端 Pipeline 打通，为端到端自动驾驶模型提供了**高置信度的仿真环境**

前置知识要求：了解 3D 重建基础概念、熟悉 Unreal Engine 基本架构、对自动驾驶仿真有初步认知

一、背景与痛点：为什么需要新一代场景重建技术¶

1.1 空间智能的崛起¶

空间智能（Spatial Intelligence）正在成为 AI 领域的新热点。正如 AI 领域的专家所言："看见世界远远不够，有了空间智能之后，AI 可以帮助我们去更好地理解这个世界"。

空间智能概念 空间智能技术让 AI 能够理解三维世界

人类通过双眼的视差来感知深度和空间位置，这种生物视觉原理被应用到计算机视觉领域，催生了多种三维重建技术。

1.2 三维场景的应用场景¶

三维重建技术已广泛应用于多个领域：

三维场景应用 三维重建在多个行业的应用

传统测绘领域 - 通过无人机或街景车快速扫描场景 - 生成三维场景数据用于测绘分析

影视动画行业 - 扫描真实场景作为虚拟背景 - 《黑悟空》等游戏大作使用此技术采集场景数据

自动驾驶仿真 - 构建城市道路的三维模型 - 训练和测试自动驾驶算法

高精度地图 - 为自动驾驶提供精确的地图数据 - 支持车道级定位和导航

1.3 传统方案的局限性¶

现有的三维模型生产方式主要依赖**人工建模**——通过美术人员在电脑上手动创建，再通过贴图实现高保真效果。

传统建模方式 传统的三维模型生产流程

核心痛点 - 这是一个**劳动密集型**的领域 - 成本高昂，周期漫长 - 无法快速响应算法训练对海量场景的需求

虽然摄影测量技术可以自动重建场景，但也存在明显缺陷：

**玻璃、反光材质**的重建效果极差
难以处理**动态物体**
重建质量参差不齐

二、核心原理解析：三维重建技术的演进¶

2.1 从立体视觉到激光雷达¶

三维重建技术从 **1980 年代**开始发展，经历了几个关键阶段：

重建技术演进 三维重建技术的发展历程

第一阶段：立体视觉（Stereo Vision）

通过拍摄一系列照片，结合重建算法还原三维结构。这种方法模拟人眼的双目视觉原理。

第二阶段：激光雷达（LiDAR）

引入主动测距技术，通过激光测量获取精确的深度信息。

第三阶段：多模态融合

结合视觉和激光雷达的优势，实现更准确的三维重建。

2.2 NeRF 与 3D Gaussian Splatting¶

近年来，神经辐射场（NeRF） 和 3D Gaussian Splatting 成为三维重建领域的热门技术。

3DGS 技术 3D Gaussian Splatting 重建效果

3D Gaussian Splatting 的核心优势：

渲染速度快：相比 NeRF 有数量级的性能提升
视觉效果逼真：能够很好地还原真实场景的光照和细节
训练效率高：几小时内即可完成场景训练

关键技术点 3D Gaussian Splatting 使用大量带有颜色和透明度属性的高斯椭球来表示场景，通过光栅化（而非光线追踪）实现实时渲染。

2.3 多尺度重建技术¶

三维重建技术在不同尺度上都有应用：

从纳米到千米的多尺度重建应用

纳米级别 - 电子显微镜成像 - 分子结构可视化

毫米级别 - DNA 螺旋结构呈现 - 医学影像重建

米级别 - 建筑和室内场景 - 人体数字化

千米级别 - 城市级场景重建 - 自动驾驶仿真场景

三、技术方案深度解析：从采集到仿真的完整链路¶

3.1 整体技术架构¶

技术架构 从采集到应用的完整 Pipeline

整个技术路径可以分为四个核心环节：

数据采集：使用专业设备采集原始数据
场景重建：在云端进行 3D Gaussian 训练
引擎集成：将重建模型导入 UE5
仿真应用：支持算法测试和训练

3.2 数据采集方案¶

一体化数据采集设备

采集设备采用**硬件一体化**设计，集成了：

多路视觉相机：捕获高分辨率图像
激光雷达：获取精确的深度信息
IMU 和 GNSS：提供精确的位姿数据

采集方式支持多种形态：

车载采集：采集车搭载设备扫描道路
手持采集：人员手持设备采集室内或特定区域
空地一体：结合无人机和地面设备

3.3 3D Gaussian 训练流程¶

训练流程 3D Gaussian 场景构建流程

步骤一：数据预处理

图像去畸变和颜色校正
位姿优化和对齐
动态物体过滤

步骤二：云端训练

初始化高斯点云
迭代优化高斯参数
自适应密度控制

步骤三：模型优化

去除浮点和噪声
场景语义分割
要素提取和分离

实际案例 扫描一个停车场，采集过程约 1-2 小时，云端训练 一晚上，第二天上午即可完成整个场景重建。

3.4 与 UE5 的深度集成¶

UE5 集成 3D Gaussian 模型在 UE5 中的渲染效果

通过 SDK 或插件将 3D Gaussian 模型导入 UE5：

实时渲染：支持高帧率的场景渲染
动态元素叠加：在 Gaussian 背景上添加车辆、行人等动态对象
传感器仿真：支持相机、激光雷达等传感器模拟

四、混合仿真引擎：3D Gaussian + UE5 的最佳实践¶

4.1 为什么需要混合仿真¶

混合仿真架构 混合仿真引擎架构示意

纯 3D Gaussian 场景存在几个关键问题：

静态场景限制：无法表示动态物体
功能性缺失：交通灯等元素没有实际功能
编辑困难：难以修改和调整场景

因此需要将 3D Gaussian 的静态场景 与 UE5 的动态资产 相结合。

4.2 混合渲染架构¶

静态层（3D Gaussian）

道路、建筑、植被等静态背景
提供高真实感的视觉效果
成本低、生成快

动态层（UE5 资产）

车辆、行人、交通参与者
交通灯、交通标志
天气和光照效果

关键优势 - 通过极低的成本获得更高真实感的环境 - 保留传统仿真引擎的所有功能 - 动态场景描述语言和传感器仿真体系完全兼容

4.3 仿真平台产品架构¶

仿真平台整体产品架构

平台提供多层次的解决方案：

云端大规模并发

支持数百路算法同时运行
用于算法训练和回归测试

硬件在环仿真

面向主机厂的控制器测试
支持多路传感器信号模拟

虚拟驾驶平审

用于驾驶员研究和评估
提供高沉浸感的驾驶体验

4.4 传感器仿真适配¶

传感器仿真 多传感器同时仿真

仿真系统需要适配多种传感器：

视觉传感器 - 模拟不同型号相机的特性 - 支持镜头畸变、噪声等效果

激光雷达 - 物理准确的点云仿真 - 不同材质的反射率模拟

毫米波雷达 - 目标检测和距离测量 - 多径反射效果

五、生产级实战：挑战与解决方案¶

5.1 分布式渲染架构¶

分布式架构 分布式仿真渲染架构

对于大规模仿真场景，需要分布式的渲染架构：

多个 UE5 节点部署在不同机器上
常用 **8 卡 GPU 服务器**配置
支持 **50+ 传感器**同时仿真

实际案例 港口设备仿真需要 50 个传感器，使用 3 台 8 卡机完成整个仿真过程。

5.2 云端大规模测试¶

云端测试 云端大规模算法测试

云端仿真面临几个核心挑战：

稳定性要求 - 长时间运行不能崩溃 - 内存管理和资源回收

性能要求 - 实时渲染帧率保证 - 多路并发的负载均衡

置信度要求 - 场景真实感足以"欺骗"算法 - 传感器信号与真实数据一致

5.3 面向出海的全球场景¶

全球场景 面向不同地区的仿真场景

自动驾驶算法需要在全球不同地区运行，这带来了场景多样性的挑战：

不同的交通规则：左行/右行、交通标志差异
不同的道路特征：道路宽度、路口设计
不同的环境条件：气候、光照、植被

解决方案：快速采集和重建不同地区的道路场景。

5.4 3D Gaussian 的局限性¶

虽然 3D Gaussian 技术前景广阔，但仍存在一些挑战：

技术挑战 3D Gaussian 在户外场景的效果

采集要求高 - 需要重复采集覆盖所有视角 - 采集密度不足会导致模糊

定位精度要求 - 位姿误差会导致重建失真 - 需要高精度的定位系统

光照和阴影处理 - 强光照条件下效果下降 - 阴影处理仍是难点

六、数据合成与算法训练¶

6.1 端到端自动驾驶的数据需求¶

端到端自动驾驶数据训练流程

以 Tesla 为代表的端到端自动驾驶系统，背后是一套**神经网络大模型**，需要海量的训练数据：

视觉数据：多路相机图像
控制标签：方向盘、油门、刹车
场景标注：车道线、障碍物、交通参与者

6.2 仿真数据的价值¶

为什么需要仿真数据？

覆盖 Corner Case - 真实道路难以遇到的极端场景 - 危险场景（碰撞、紧急制动）

数据增强 - 天气变化（雨、雪、雾） - 光照变化（日出、日落、夜间）

标注自动化 - 仿真数据天然带有标注 - 消除人工标注的成本和误差

6.3 训练与测试的差异¶

训练测试对比 算法测试与训练的不同需求

面向测试 - 验证算法功能正确性 - 硬件在环测试 - 功能回归测试

面向训练 - 生成海量训练数据 - 要求高真实感 - 支持大规模并发

七、虚拟驾驶评估系统¶

7.1 驾驶模拟器架构¶

驾驶模拟器 虚拟驾驶评估系统架构

虚拟驾驶评估系统的典型组成：

运动平台 - 3 自由度或 6 自由度 - 模拟车辆的加减速和转向

视觉系统 - 环幕显示或 VR 头显 - 提供沉浸式驾驶体验

交互设备 - 方向盘、踏板 - 驾驶员生理信号采集

7.2 3D Gaussian 在驾驶模拟器中的应用¶

驾驶模拟效果 基于 3D Gaussian 的真实场景驾驶模拟

传统驾驶模拟器使用美术制作的虚拟场景，成本高昂。使用 3D Gaussian 技术：

快速重建真实道路场景
在真实场景基础上添加动态交通
大幅降低场景制作成本

实际案例 扫描香港道路场景，用于左驾车辆的驾驶评估。

八、方案对比与实战建议¶

8.1 三种场景生产方案对比¶

方案 A：传统美术建模 - 优势：质量完全可控，支持任意修改 - 劣势：成本极高，周期漫长 - 适用场景：高质量要求的展示场景、品牌宣传

方案 B：摄影测量重建 - 优势：自动化程度高，成本适中 - 劣势：反光材质效果差，动态物体处理困难 - 适用场景：大规模城市场景的快速重建

方案 C：3D Gaussian Splatting - 优势：真实感高，成本低，生成快 - 劣势：视角受限，编辑困难 - 适用场景：自动驾驶仿真、虚拟驾驶评估

8.2 避坑指南¶

采集阶段

采集密度：确保足够的重叠率，避免模糊
光照一致性：避免在光照剧烈变化时采集
动态物体：尽量在交通稀少时采集

训练阶段

位姿精度：使用高精度 SLAM 或 RTK 定位
动态物体剔除：训练前进行语义分割
资源分配：根据场景大小合理分配 GPU 资源

集成阶段

坐标系对齐：确保 Gaussian 场景与 UE5 坐标系一致
LOD 优化：远距离使用低精度渲染
动态物体交互：处理动态对象与静态场景的遮挡关系

8.3 性能优化建议¶

渲染优化 - 使用 Frustum Culling 剔除视锥外的 Gaussian - 实现 Level of Detail 根据距离调整精度 - 考虑 Tile-based Rendering 优化 GPU 利用率

内存优化 - 流式加载：按需加载场景区块 - 压缩存储：使用量化和压缩减少内存占用 - 实例化：对重复元素使用实例化渲染

九、总结与展望¶

9.1 核心技术收益¶

3D Gaussian Splatting + UE5 混合仿真引擎带来的核心价值：

成本降低：场景生产成本降低一个数量级
效率提升：从采集到可用的周期缩短至天级
真实感提升：基于真实数据，置信度大幅提高
兼容性好：与现有仿真体系完全兼容

9.2 未来发展方向¶

4D Gaussian - 支持动态场景的重建和渲染 - 时序一致性的保证

世界模型（World Model） - AI 驱动的场景生成 - 端到端的数据合成

更高自动化 - 全自动的采集-重建-集成流程 - 智能化的场景编辑工具

结语空间智能技术正在深刻改变自动驾驶仿真领域。3D Gaussian Splatting 以其独特的优势，成为连接真实世界与虚拟仿真的桥梁。结合 Unreal Engine 强大的实时渲染能力，我们正在迈向更高效、更真实的仿真时代。

本文基于 UFSH2025 会议分享内容整理，感谢演讲者张维维和鲍世强的精彩分享。