«

Gemini不厉害?蚂蚁Ling-1T才是推理之王。

qimuai 发布于 阅读:8 AI新闻


Gemini不厉害?蚂蚁Ling-1T才是推理之王。

最新AI落地实操,点击了解:https://qimuai.cn/

刚刚,AI圈炸了。

蚂蚁集团扔出一颗重磅炸弹:万亿参数大模型Ling-1T,全面开源。这不是普通迭代,而是冲着“复杂推理之王”来的。10月9日发布当天,代码已登陆HuggingFace和ModelScope,开发者随手可下载。

它凭什么敢称王?

参数规模破万亿,却用了MoE架构——每次推理只激活50亿左右参数。好比一个万人团队,每次只派最专业的五人小组上场,既保留知识储备,又闪电响应。预训练吞下20万亿tokens高质量语料,专攻法律、金融、科研等高难度领域。128K上下文长度,一本《三体》都能一口气读完并分析。

但参数和架构只是基本功,真本事在推理。

数学竞赛AIME 25榜单上,Ling-1T正确率冲上70.42%,微弱但坚定地压过Gemini 2.5 Pro的70.10%。更关键的是,它用更少的计算资源拿下高分。代码生成、逻辑推演、多轮对话,几乎全面超越DeepSeek等开源对手,甚至部分任务逼近闭源旗舰GPT-5。

背后的秘密武器是两个:演进式思维链(Evo-CoT),让推理过程像人一样逐步推演、可追溯、可修正;“语法-功能-美学”混合奖励机制,确保输出结果不仅正确,还要实用、甚至优雅。

这意味着什么?

开发者拿到的是“出厂即巅峰”的推理引擎。完全开源,配套ATorch等工具链,从手机到云都能部署。蚂蚁承诺持续迭代注意力机制和智能体交互——这不仅是模型,更是通往通用智能的基石。

看看这张对比表就明白格局变了:

模型 参数 架构 核心能力 开源 关键成绩
Ling-1T 1万亿 MoE 复杂推理、代码生成 完全开源 AIME25: 70.42%,多项领先
Qwen2 1万亿级 MoE 长文本、多模态 完全开源 部分任务略低
DeepSeek-V3.1 1万亿级 MoE 复杂推理 完全开源 被Ling-1T超越
GPT-5-main >1万亿 未公开 闭源强普适 闭源 部分任务token效率更低

国产开源模型,第一次在推理硬实力上站到世界第一梯队。而且,是开着源、带着全套餐具来的。

这不只是技术突破,更是生态宣言。当闭源模型还在高墙内迭代,开源社区已经握住了同等级别的推理引擎。所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读