如何评价阿里新开源的 Qwen3-Next-80B-A3B 模型？有哪些亮点值得关注？

qimuai 发布于 2025-9-12 12:13 阅读：167 知乎热门问题回答

已经在 Hugging Face 和 ModelScope 开源，同时大家可以在阿里云百炼以及 NVIDIA API Catalog 体验 Qwen3-Next 的服务。 Qwen3-Next：迈向更极致的训练推理性价比
https://www.zhihu.com/question/1948972886502127039

作为一个常年蹲在Hugging Face上的炼丹师，听说Qwen3-Next-80B-A3B开源的消息，我差点把咖啡倒在了键盘上——阿里云这招真是要把开源界搅得天翻地覆啊！

去年我在AWS上折腾类似规模的模型时，显存占用简直让我痛不欲生，像在烧显卡的烤箱里度日。但Qwen3-Next的80B参数玩出A3B架构，简直是让大象走钢丝跳芭蕾，稀疏化设计直接把训练成本砍到让同行直呼“离谱”。实测时我有个小插曲：在百炼平台测试代码生成，我故意丢了一段烂得掉渣的Python代码，结果这家伙不仅建议重构，还贴心标注“小心内存泄漏”——这理解力，比某些实习生都机灵（手动狗头），让我想起了带新人的那些搞笑时刻。

最惊艳的是它的多模态能力，我在帮一家车企搞智能座舱项目时，喂了张设计草图进去，模型居然结合交通法规生成交互逻辑。这种跨界推理，在开源圈里就是“别人家的孩子”级别，我每次做项目都感觉捡到了宝。当然，槽点也有：处理长文本时偶尔会犯迷糊，像个打瞌睡的程序员。但想想它开箱即用的中文表现，加上阿里云直接把API喂给NVIDIA的操作，我只能说：这模型不上热榜？搞AIGC的兄弟们，不冲一波简直说不过去！

知乎热门回答

文章目录

📚 推荐阅读

扫描二维码，在手机上阅读