3 张相片 → 全景 3D:苹果携手推出革命性 AI 模型 Matrix3D,简化 3D 重建进程
5 月 14 日音讯,科技媒体 9to5Mac 昨日(5 月 13 日)发布博文,报导称苹果机器学习团队携手南京大学和香港科技大学,推出名为 Matrix3D 的 3D AI 模型,专心于从少量 2D 相片中重建实在国际的物体和场景。
用户只需供给几张图画,模型就能主动生成高质量的 3D 输出。这不只简化了操作,还为使用范畴打开了新机遇,进一步推动了 AI 范畴的协作。
拍摄丈量技能使用相片进行丈量,然后创立 3D 模型或地图。现在的流程依靠姿势估量和深度猜测等多个独立模型来处理具体步骤,而这种分段办法简单导致低效和过错。
Matrix3D 则改造了这一体系。它一次性整合图画、相机参数(如视点和焦距)以及深度数据等一切进程,经过一致架构处理这些元素,减少了中间环节,让重建进程更流通、更牢靠。研究者指出,这种整合规划明显降低了人为过错的危险,并提高了全体功能。
在练习战略方面,研究者采用了掩码学习办法,类似于前期 Transformer 根底 AI 体系。这种技能学习了 ChatGPT 前期版别的练习理念,在练习进程中随机躲藏部分输入数据,迫使模型学会“填充空白”。这强化了模型的适应性。即便数据集较小或不完整,Matrix3D 也能有用学习要害特征。
测验成果证明了 Matrix3D 的强壮体现。用户只需三张输入图画,该模型就能生成具体的 3D 重建,包括物体和整个环境,为沉溺式技能带来了实践使用潜力。附上演示视频如下:
例如,在 Apple Vision Pro 等头显设备中,Matrix3D 能够创立传神的虚拟场景,提高用户体会。研究者表明,这种才能将加快元世界和增强实际的开展。
参阅。
Matrix3D: Large Photogrammetry Model All-in-One。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等方式),用于传递更多信息,节约甄选时刻,成果仅供参阅,一切文章均包括本声明。
内容来源:https://fastrans.nhobethoi.com/app-1/công ty tnhh apple việt nam,http://chatbotjud.saude.mg.gov.br/app-1/o'que-e-borboleta-paraguaia
(责任编辑:男性)