«

点一下照片,3D世界即刻生成!Meta AI的SAM 3D模型碾压前代5:1。

qimuai 发布于 阅读:18 AI新闻


点一下照片,3D世界即刻生成!Meta AI的SAM 3D模型碾压前代5:1。

最新AI落地实操,点击了解:https://qimuai.cn/


你拍张照,它直接造个 3D 世界。

不是电影特效,不是专业建模师折腾几周的成果。
就是你现在手机相册里,任何一张普通的照片。

点一下照片里的沙发,一个完整的、带纹理的3D沙发模型,立刻生成,360度无死角旋转。
点一下照片里的人物,哪怕是背影或侧脸,一个能灵活摆姿势的3D人体,瞬间立在你面前。

这听起来像魔法?不,这是 Meta AI 刚刚扔进科技圈的一枚“深水炸弹”:SAM 3D 系列模型。

它把“从2D到3D”的门槛,砸到了地板级别。

一、点一下,世界从“平”变“立”

我们生活在3D世界,但记录和传播它,大多靠2D的屏幕和照片。从2D回推3D,是计算机视觉的终极难题之一。

以往,这事需要多角度拍摄、激光扫描,或者强大的图形学知识。现在,SAM 3D告诉你:一张图,就够了。

它其实是一对“孪生兄弟”:

这意味着什么?
意味着设计师找灵感,拍张街景就能提取建筑模型;意味着你网购家具,拍照就能看它在自家客厅的3D效果;意味着游戏和动画制作,捕捉动作的成本将急剧降低。

二、它强在哪?让AI教AI

技术爆发从来不是偶然。SAM 3D 令人瞠目的能力,背后是 Meta 一套“狠辣”的训练策略:

  1. “模型在环”数据流水线:简单说,就是用已经有点聪明的AI,去自动标注更复杂、更优质的数据来喂给新的AI。像滚雪球,越滚越大,越滚越精。
  2. “三段式”训练法:借鉴了训练大语言模型(LLM)的思路。先进行大规模三维预训练(打好基础),再在多任务上进行统一训练(变成多面手),最后在特定任务上微调(成为专家)。这让它既有广度,又有深度。
  3. 合成数据循环:在虚拟3D世界里生成海量“照片-3D模型”配对数据,解决现实世界数据难获取的问题。

结果就是,在权威的SA-3DAO数据集上,它的表现碾压了之前的领先模型,胜出比例达到5:1

当然,它并非完美之神。目前输出分辨率还有限,面对极度复杂的细节或多物体紧密纠缠的场景,它也会“犯晕”。但这一切,只是开始。

三、一个“人人可3D”的时代加速来了

Meta 已经大方地开放了演示体验。去官网(ai.meta.com/sam3d/),你就能亲手试试这种“指鹿为马…不,指2D为3D”的魔力。

这不仅仅是多了一个酷炫的工具。

它传递出一个再清晰不过的信号:3D内容生成的门槛,正在以我们肉眼可见的速度崩塌。 从OpenAI用Sora炸掉视频生成,到Meta用SAM 3D重塑3D重建,AI正在把曾经高度专业化的创作,变成普通人敲敲键盘、点点鼠标就能触及的能力。

未来,你的每一张照片,都可能是一个3D世界的入口。


所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读