AMD硬刚NVIDIA成功！ZAYA1模型背后，隐藏着这些秘密……

qimuai 发布于 2025-11-25 18:03 阅读：57 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

嘿，你听说了吗？AI训练圈刚刚爆出大新闻——AMD联手初创公司Zyphra，用自家硬件硬生生练出了全球首个纯AMD平台的大模型ZAYA1！这回，NVIDIA的“铁王座”怕是真要晃动了。

ZAYA1是什么来头？它可不是普通模型，而是采用了“混合专家”（MoE）架构的狠角色。想象一下，一个超级大脑里藏了无数专业顾问，每次任务只唤醒最相关的几位。模型总参数高达83亿，但单次推理只激活7.6亿，计算效率直接拉满，训练成本还大幅降低。

怎么做到的？秘密藏在AMD的Instinct MI300X GPU里。高带宽内存让模型训练无需分片，数据吞吐又猛又稳。整个集群性能突破750PFLOPs，吞下14万亿tokens的数据，还用了“课程学习”策略——从简单题到复杂题逐步进阶，模型在数学、代码和推理上的能力一路飙升。

更绝的是ZAYA1的注意力机制创新：CCA（压缩卷积注意力）。它在传统注意力里嵌入卷积操作，像给数据“瘦身”，显存占用降了，长序列处理却更流畅。这招让ZAYA1在多项测试中碾压Qwen-3-4B、Gemma-3-12B等对手，数学和STEM推理表现尤其亮眼。

为什么这场合作值得关注？它证明AMD已稳坐AI训练的高性能牌桌。从分布式I/O优化到模型保存时间缩短，整个训练流程为AMD系统量身定制。硬件垄断的坚冰，正被一寸寸敲开。

AI世界的竞争，从来不只是技术之争，更是生态之战。ZAYA1的诞生，让未来多了一种可能。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

文章目录

扫描二维码，在手机上阅读