阿里发布Qwen-Image-2.0：闭眼出图，睁眼修图，这可能是最懂中文的AI绘图工具！

qimuai 发布于 2026-2-10 18:02 阅读：1 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

阿里放大招：闭眼出图，睁眼修图！

这可能是你能玩到的最懂中文语境的AI绘图工具。

朋友们，昨晚我的设计圈和电商圈微信群炸了。

不是出了什么大新闻，而是阿里云的通义千问团队，悄无声息地扔出了一颗技术“深水炸弹”——Qwen-Image-2.0。

它不只是一个升级版。用官方的话说，这是一次“范式聚合”：把过去两条技术路线，“图像生成” 和 “图像编辑”，彻底拧成了一股绳。

什么意思？

以前你要AI画个图，画好了觉得哪里不对劲，得切到另一个工具里去修修补补。现在，从无到有，再从有到精，在一个模型里就能闭环完成。

这意味着，创作的门槛和流程，被再次碾平。

01 范式聚合：生成与编辑，从此不分家

先别被“基础模型”、“MMDiT架构”这些词唬住。

你只需要记住一个核心：Qwen-Image-2.0是一个既能“生”又能“改”的多面手。

这背后是研发思路的根本转变。

过去，文生图和图生图（编辑）往往是分开训练的模型，好比一个擅长从零画素描，另一个擅长在照片上PS。而现在，阿里把这两种能力“喂”给同一个模型学习，让它天生就理解“创造”与“修改”是一体两面。

结果就是，它在 GenEval、DPG 这些专业盲测榜上，拿下了多个项目的 SOTA（最先进）成绩。

尤其是两项“老大难”：复杂文本渲染和自动多元素布局，表现突出。这对需要精确文字的海报、电商 Banner、文创设计来说，简直是刚需。

02 三大核心能力，拳拳到肉

那么，具体强在哪？我们拆开看。

第一，文字渲染，“准”到可怕。

这是它的招牌技能。你让它生成一张“庆祝‘AI科技前沿’公众号粉丝破百万的复古金属勋章海报，下方有一行小字‘感谢每一份关注’”，它真能给你把文字老老实实、清晰可辨地排上去，而不是一堆乱码或“鬼画符”。

它支持超长指令（最高1k token），中英文混输也没压力。对于强依赖文字准确性的场景，官方甚至直接推荐使用其加速版本 qwen-image-plus。

第二，真实质感，“真”到细腻。

皮肤上的毛孔、毛衣的针织纹理、玻璃的反光、旧建筑的斑驳… 这些细节决定了图片的“贵气”还是“廉价”。

Qwen-Image-2.0 原生支持最高 2K分辨率（2048×2048），这为细节刻画留足了像素空间。无论是想生成有呼吸感的人像，还是充满质感的静物，它都有了更强的表现力。

第三，审美对齐，“美”得自然。

AI绘图，最怕“一眼假”和“构图丑”。新模型在人物肢体、面部质感的自然度上大幅提升，同时具备了更高的“排版美学”意识。

比如你让它设计一张留白较多的极简风卡片，它可能会自动在恰当的位置，为你布置好该有的文字，而不是堆在角落或挡住主体。

简而言之：它更懂你想要什么，并且有能力实现得更精致、更准确。

03 怎么用？两条路径，任君选择

如果你已经摩拳擦掌，想亲自试试它的威力，现在有两个入口。

路径一：深度玩家，走 API

如果你是开发者，或者有工作流集成的需求，可以通过 阿里云百炼平台 申请API邀测。

这里提供了几个不同侧重点的模型变体：

qwen-image-max：追求极致真实感和细节，选它。
qwen-image-plus：性价比之选，处理速度快，特别擅长文字渲染任务。
qwen-image-edit：专攻编辑功能，想对现有图片做局部修改、换风格、增删物体，就调用它。

API调用按成功生成的张数计费（失败不算钱），生成的图片会给你一个24小时内有效的阿里云OSS链接。

路径二：尝鲜用户，免费用

如果你只是想快速感受一下，最简单的方法就是去 Qwen Chat（chat.qwen.ai）。

在对话框里选择“图像生成”功能，输入你的创意，就能免费体验到它的核心生图能力。编辑功能目前看主要集成在API中。

想象一下这个场景：一个电商运营，用几句话生成一张主打商品场景图，发现模特手势有点别扭，紧接着输入“把手部姿势调整得更自然”，直接完成修改。

一个自媒体编辑，快速生成文章头图，然后指令它“把标题文字放大，换成书法字体”，一分钟搞定排版。

工具进化的终点，是让创意和执行之间的那道鸿沟消失。

当“想”和“做”几乎可以同步，限制我们的，或许就只剩下想象力本身了。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

AI每日进展

文章目录

📚 推荐阅读

扫描二维码，在手机上阅读