李飞飞创立的创业团队World Labs在空间智能领域取得了突破性进展,其最新模型可通过单张图像或文本提示生成可自由导航、持久存在且支持自定义操控的3D世界。这一成果不仅实现了虚拟环境几何结构的精准还原,更突破了传统模型在空间规模、风格一致性及时间限制上的瓶颈。
该模型生成的3D场景具备高度连贯的几何特征,用户可在浏览器中实现自由视点漫游,探索视角外的隐藏空间。相较于传统深度图或点云技术,其构建的环境支持更复杂的空间交互,甚至允许将生成的场景导出为高斯点云,通过开源Spark渲染库无缝集成至Three.js平台,实现跨设备(台式机、笔记本、移动端及VR头显)的高效渲染。这一特性为网页端3D应用开发提供了全新可能。
在视觉风格方面,模型展现了强大的适应性,无论是卡通化的海绵宝宝场景还是写实风格的赛博朋克城市,均可通过输入不同风格的图像完成转化。创作者能够持续迭代调整,最终找到最契合需求的虚拟世界表达形式。更引人注目的是,模型支持将多个独立场景无缝拼接,用户可像拼图般扩展虚拟空间,构建出房间级至城市级的宏大环境。
与谷歌Genie等同类模型相比,World Labs的成果实现了关键突破:生成的3D世界永久存续且完全免费,用户可随时通过链接访问并保存创作内容,无需担忧时间限制或额外费用。目前,该模型已通过Marble平台开放Beta预览版,早期用户反馈显示,其构建的虚拟世界在规模、细节及交互自由度上均超出预期。
从游戏开发到建筑可视化,从教育模拟到艺术创作,这一技术正在重新定义虚拟空间的构建方式。正如团队展示的案例所示,用户不仅能创建带有路线轨迹导航的复杂场景,更可自由导出内容应用于下游项目。随着开源工具链的完善,未来或许将有更多创作者借助这一平台,将天马行空的想象转化为可触摸的数字世界。 |