
【导语:4月17日消息,英伟达近日发布AI系统Lyra 2.0,能凭单张照片生成可交互3D环境,解决长程生成难题,还为机器人仿真训练等提供解决方案。】

英伟达最新发布的AI系统Lyra 2.0,具备强大的功能,仅需单张照片就能生成大规模、可交互探索的3D环境。这一突破为3D场景的构建带来了全新的方式,极大地提高了3D环境生成的效率。

在长距离视角移动中,以往的模型存在场景“空间遗忘”与“时间漂移”的问题。而Lyra 2.0成功解决了这些核心难题,使得生成的3D环境在长程视角移动中更加稳定和准确。
针对现有模型在长程生成中易出现的画面扭曲与结构崩塌问题,Lyra 2.0引入了两项关键技术。一是通过存储并检索每帧的3D几何数据实现信息路由,让模型在重返已探索区域时能准确调用历史信息,避免重复生成;二是采用自增强训练策略,使模型在训练阶段接触自身生成的带瑕疵内容,主动纠正误差累积,保持画面长期稳定。

Lyra 2.0支持交互式探索与相机轨迹规划,生成的视频可直接提升为3D高斯泼溅(3DGS)或网格模型,并能无缝导出至NVIDIA Isaac Sim等物理引擎。这为机器人仿真训练与虚拟场景搭建提供了高质量、可落地的解决方案,推动了相关领域的发展。
编辑观点:英伟达Lyra 2.0的发布是AI在3D环境生成领域的重大突破,解决了关键难题并提供了实用方案,有望在机器人、虚拟场景等领域带来变革。

被折叠的 条评论
为什么被折叠?



