«

阿里发布Qwen-Image-2.0:闭眼出图,睁眼修图,这可能是最懂中文的AI绘图工具!

qimuai 发布于 阅读:1 AI新闻


阿里发布Qwen-Image-2.0:闭眼出图,睁眼修图,这可能是最懂中文的AI绘图工具!

最新AI落地实操,点击了解:https://qimuai.cn/

阿里放大招:闭眼出图,睁眼修图!

这可能是你能玩到的最懂中文语境的AI绘图工具。

朋友们,昨晚我的设计圈和电商圈微信群炸了。

不是出了什么大新闻,而是阿里云的通义千问团队,悄无声息地扔出了一颗技术“深水炸弹”——Qwen-Image-2.0

它不只是一个升级版。用官方的话说,这是一次“范式聚合”:把过去两条技术路线,“图像生成”“图像编辑”,彻底拧成了一股绳。

什么意思?

以前你要AI画个图,画好了觉得哪里不对劲,得切到另一个工具里去修修补补。现在,从无到有,再从有到精,在一个模型里就能闭环完成。

这意味着,创作的门槛和流程,被再次碾平。


01 范式聚合:生成与编辑,从此不分家

先别被“基础模型”、“MMDiT架构”这些词唬住。

你只需要记住一个核心:Qwen-Image-2.0是一个既能“生”又能“改”的多面手。

这背后是研发思路的根本转变。

过去,文生图和图生图(编辑)往往是分开训练的模型,好比一个擅长从零画素描,另一个擅长在照片上PS。而现在,阿里把这两种能力“喂”给同一个模型学习,让它天生就理解“创造”与“修改”是一体两面。

结果就是,它在 GenEval、DPG 这些专业盲测榜上,拿下了多个项目的 SOTA(最先进)成绩。

尤其是两项“老大难”:复杂文本渲染自动多元素布局,表现突出。这对需要精确文字的海报、电商 Banner、文创设计来说,简直是刚需。

02 三大核心能力,拳拳到肉

那么,具体强在哪?我们拆开看。

第一,文字渲染,“准”到可怕。

这是它的招牌技能。你让它生成一张“庆祝‘AI科技前沿’公众号粉丝破百万的复古金属勋章海报,下方有一行小字‘感谢每一份关注’”,它真能给你把文字老老实实、清晰可辨地排上去,而不是一堆乱码或“鬼画符”。

它支持超长指令(最高1k token),中英文混输也没压力。对于强依赖文字准确性的场景,官方甚至直接推荐使用其加速版本 qwen-image-plus

第二,真实质感,“真”到细腻。

皮肤上的毛孔、毛衣的针织纹理、玻璃的反光、旧建筑的斑驳… 这些细节决定了图片的“贵气”还是“廉价”。

Qwen-Image-2.0 原生支持最高 2K分辨率(2048×2048),这为细节刻画留足了像素空间。无论是想生成有呼吸感的人像,还是充满质感的静物,它都有了更强的表现力。

第三,审美对齐,“美”得自然。

AI绘图,最怕“一眼假”和“构图丑”。新模型在人物肢体、面部质感的自然度上大幅提升,同时具备了更高的“排版美学”意识。

比如你让它设计一张留白较多的极简风卡片,它可能会自动在恰当的位置,为你布置好该有的文字,而不是堆在角落或挡住主体。

简而言之:它更懂你想要什么,并且有能力实现得更精致、更准确。

03 怎么用?两条路径,任君选择

如果你已经摩拳擦掌,想亲自试试它的威力,现在有两个入口。

路径一:深度玩家,走 API

如果你是开发者,或者有工作流集成的需求,可以通过 阿里云百炼平台 申请API邀测。

这里提供了几个不同侧重点的模型变体:

API调用按成功生成的张数计费(失败不算钱),生成的图片会给你一个24小时内有效的阿里云OSS链接。

路径二:尝鲜用户,免费用

如果你只是想快速感受一下,最简单的方法就是去 Qwen Chat(chat.qwen.ai)

在对话框里选择“图像生成”功能,输入你的创意,就能免费体验到它的核心生图能力。编辑功能目前看主要集成在API中。


想象一下这个场景:一个电商运营,用几句话生成一张主打商品场景图,发现模特手势有点别扭,紧接着输入“把手部姿势调整得更自然”,直接完成修改。

一个自媒体编辑,快速生成文章头图,然后指令它“把标题文字放大,换成书法字体”,一分钟搞定排版。

工具进化的终点,是让创意和执行之间的那道鸿沟消失。

当“想”和“做”几乎可以同步,限制我们的,或许就只剩下想象力本身了。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读