«

GPT-5对手出现?美团开源模型炸裂,专家说这才是未来!

qimuai 发布于 阅读:7 AI新闻


GPT-5对手出现?美团开源模型炸裂,专家说这才是未来!

最新AI落地实操,点击了解:https://qimuai.cn/


标题:美团深夜开源5600亿参数“猛兽”!推理能力炸裂,全球开发者都坐不住了

就在昨晚,科技圈又被一枚“深水炸弹”炸醒了。

美团突然正式开源了其大规模推理模型——LongCat-Flash-Thinking。不说废话,直接上重点:5600亿参数,主打复杂推理+工具调用,并且——全部公开,代码、模型、论文,一律送上

这已经不是“放大招”了,这是直接把技术家底摊开给你看。


一、5600亿参数,但居然很省?

一听“5600亿”,很多人第一反应是:这得多少张卡才跑得动?

别急。LongCat用上了目前大模型界最热的MoE架构(混合专家系统)。也就是说,虽然参数总量惊人,但每次推理只会激活其中一部分——实际动态调动在186亿到313亿参数之间。

这样做的直接好处是:推理速度快、资源占用少、还省电。
换句话说,它既猛又省,不像某些“暴力计算怪兽”,一跑起来电表都转出火星子。


二、“会推理,还会用工具”,

这才是真·智能体

如果说ChatGPT是“语言大师”,那LongCat更像是“解题高手 + 工具达人”。

它特别擅长多步骤推理:不管是解数学题、写代码、逻辑分析,还是自己调用外部API、查资料、操作软件,它都能连贯地完成整条任务链。

也就是说,你不再需要一步步教它“先这样做、再那样做”,它自己能想清楚整个流程,并且主动拿起工具干活

这种能力,是目前很多大模型还做不到的——“非形式化推理”(靠语言逻辑)和“形式化推理”(靠工具和代码)的结合,让它更接近“人”的思考模式。


三、训练方法两大创新:

冷启动 + 大规模强化学习

美团这次没走寻常路,训练流程里藏了不少干货:

这说明什么?
模型不是堆数据硬训出来的,是有方法、有节奏、“有教案”的——这才是真正可持续的AI研发。


四、实际效果:接近GPT-5?

Token省一半,准确率仍保持90%+

根据已公布的测试结果,LongCat在AIME25等权威基准中表现极其能打:

这意味着:它不只是强,还更聪明——知道什么时候该靠自己算,什么时候该去“查手册”、“调用软件”。


五、一句话:美团这次,真的全部开源了

模型、代码、技术论文,现在已经全部发布在GitHub和HuggingFace上。

任何开发者、企业、研究者,都可以免费下载、测试、部署,甚至商用。

这无疑是中国AI开源领域的一次重磅事件。LongCat-Flash-Thinking的出现,不仅代表了中国大模型在“推理+工具调用”这条路径上的成熟,也真正让全球看到了来自东区的技术开放力。


结语:AI正在重构所有行业,

而你最好早点上手

美团的这次开源,绝不仅仅是“又多了一个模型”。

它意味着:智能体(Agent)落地应用的门槛,正在迅速降低

你可以用它做数据分析、自动流程处理、代码生成、客户服务……任何需要“动脑筋”的环节,都可能被AI重构。

所有领域都值得用AI重做一遍。


本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood。


AI每日进展

文章目录


    扫描二维码,在手机上阅读