9月2日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。
该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位,超越现有开源方法,在视频生成和3D重建任务中均表现出色。
在视频生成和视频3D重建两个任务上,Voyager也均取得更好的结果。
据介绍,混元Voyager聚焦于AI在空间智能领域的应用扩展,将为虚拟现实、物理仿真、游戏开发等领域提供高保真的3D场景漫游能力。
模型突破传统视频生成在空间一致性和探索范围上的局限,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。
据了解,混元Voyager 3D输入-3D输出的特性,与此前已开源的混元世界模型1.0高度适配,可进一步扩展1.0模型漫游范围,提升复杂场景的生成质量,并可对生成的场景做风格化控制和编辑。
此外,该模型可支持视频场景重建、3D物体纹理生成、视频风格定制化生成、视频深度估计等多种3D理解与生成应用。
官方表示,混元Voyager首次通过空间与特征结合的方式,支持原生的3D记忆和场景重建,避免了传统后处理带来的延迟和精度损失。
同时,在输入端加入3D条件保证画面视角精准,输出端直接生成3D点云,适配多种应用场景。
额外的深度信息还能支持视频场景重建、3D物体纹理生成、风格化编辑和深度估计等功能。
版权与免责声明:
凡本站注明“来源:k8凯发”的所有作品,均为浙江兴旺宝明通网络有限公司-k8凯发合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:k8凯发”。违反上述声明者,本站将追究其相关法律责任。
本站转载并注明自其它来源(非k8凯发)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:k8凯发”,本站将依法追究责任。
鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。