«

开源AI打不过闭源?蚂蚁的万亿模型,在深度思考上赢了GPT-4.5。

qimuai 发布于 阅读:0 AI新闻


开源AI打不过闭源?蚂蚁的万亿模型,在深度思考上赢了GPT-4.5。

最新AI落地实操,点击了解:https://qimuai.cn/

昨天还在为某个AI写长文写到一半开始“失忆”而头疼,今天打开GitHub,首页推荐直接给我看精神了。

蚂蚁集团,对,就是那个支付宝的蚂蚁,刚刚扔下了一颗“开源核弹”。

它叫 Ring-2.5-1T。名字有点技术范儿,但意思很直白:这是一个拥有一万亿参数的“思考模型”。关键是,它全球首个基于一种叫做“混合线性架构”的技术构建的。更关键的是,它现在免费、开源,代码和模型权重你都能直接下载。

这意味着什么?简单说,我们普通人手里能用的AI工具,天花板被瞬间捅破了。

一、 它强在哪?数学金牌选手+长文健忘症克星

如果你觉得现在的AI聊天已经够用,那可能是因为你还没用它来处理真正复杂的事。

这次开源的Ring-2.5-1T,瞄准的就是“复杂任务”。它最炸裂的成绩在数学推理上。

根据蚂蚁官方给出的数据,它在国际数学奥林匹克(IMO 2025)中国数学奥林匹克(CMO 2025)的自测成绩,已经达到了金牌水平。换句话说,让它去参加人类顶尖中学生的高智商竞赛,它能拿奖。

这不仅仅是刷题。数学推理能力,是衡量一个AI逻辑思维、分步解决问题能力的硬核指标。这项能力直接挂钩到代码生成、复杂规划、科学计算等一系列实用场景。

另一个痛点是“长文本”。让AI写份报告、生成一篇小说,经常写到后面忘了前面,质量直线下降。

Ring-2.5-1T通过其创新的混合线性注意力机制,专门优化了长序列处理。在生成超过3.2万字的长文本时,它的效率对比前代提升了3倍以上,而消耗的显存资源却大幅降低。

你可以理解为,它是个记忆力超群、思维缜密的“长跑选手”,而不是聊几句就喘的“短跑健将”。

二、 技术狠活:如何让万亿巨兽在单张显卡上奔跑?

一万亿参数?听着就吓人。现在的顶级消费级显卡,显存也就24GB。以往这种规模的模型,是科技巨头的专属玩具,需要堆成山的服务器。

蚂蚁这次的开源,打破了这个门槛。核心在于两点:

  1. 动态专家激活:模型内部就像一个拥有无数专业顾问的超级大脑。处理简单问题时,只唤醒几个相关领域的“专家”;遇到难题时,才全员激活,集思广益。这让它在保持高准确率(复杂任务提升30%)的同时,极大节约了算力。
  2. FP8混合精度与量化:这是一种“模型压缩”技术,在几乎不损失性能的前提下,把模型“瘦身”,让它能更轻松地在单张GPU上部署和运行,推理延迟降低了40%。

这意味着,开发者和企业可以用更低的成本,部署一个拥有顶级推理和长文本能力的AI大脑,来驱动自己的智能体(AI Agent)或复杂应用。

三、 开源江湖,格局变了

看一眼性能对比榜单,就能感知这次开源的冲击力。

在数学推理、代码生成、逻辑推理和智能体任务等多项核心基准测试中,Ring-2.5-1T超越了包括DeepSeek、Kimi等在内的所有主流开源“思考模型”

甚至,在需要深度思考(Heavy Thinking)的模式下,它的表现也优于GPT-4.5、Gemini 3.0 Pro、Claude Opus 4.5等闭源巨头的最新思考版本。

开源领域,很久没有出现这样在核心能力上全面领先的“标杆”了。这不仅仅是发布一个模型,更像是树立了一个新的靶子。

四、 我们能用它做什么?

模型已经躺在 Hugging FaceModelScope 上,随时可下载。官方的聊天体验页面和API服务也将马上上线。

对于开发者和企业而言,它的价值显而易见:


过去一年,我们见证了AI智能体从概念走向落地。但很多智能体还显得有些“稚嫩”,容易卡壳,逻辑链一长就崩溃。

Ring-2.5-1T这类模型的出现,正是为下一阶段的智能体,注入了最需要的“大脑”——一个真正擅长深度思考、能规划、能记忆、能推理的大脑。

门槛正在降低,能力正在飙升。那个期待已久的、能真正处理复杂现实任务的AI助手时代,脚步声越来越清晰了。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读