Qwen-Image-Edit:通义千问推出的图像编辑模型,可以进行语义和外观双重编辑

Qwen-Image-Edit是通义千问推出的图像编辑模型,它在20B参数的Qwen-Image模型基础上进一步训练而来,能同时处理图片里的语义和外观修改,比如精准改图片上的文字,还能做IP形象创作、换风格等操作,在多个公开测试里表现是最好的,已经在ModelScope、Hugging Face和GitHub上开源了。

Qwen-Image-Edit:通义千问推出的图像编辑模型,可以进行语义和外观双重编辑

Qwen-Image-Edit核心能力

  • 语义和外观都能改:把图片输进Qwen2.5-VL能控制图片要表达的意思,输进VAE Encoder能控制图片的样子。用这个能力可以做IP形象创作、让物体转方向、换图片风格,也能给图片加东西、删东西、重新画。

  • 改文字很准:中英文文字都能改,在不改原来字体、大小、风格的情况下,能给图片里的文字加内容、删内容、改内容,还能改特定文字的颜色。

  • 测试表现好:在多个公开测试里达到了目前最好的效果。

Qwen-Image-Edit技术

  • 一个是多任务训练。用了改进的多任务训练方法,把传统的文字生成图片、文字加图片生成新图片、图片生成新图片这些任务结合起来,让Qwen2.5-VL和MMDiT这两个部分的隐藏信息能更好地对应上。

  • 另一个是双重编码。把图片分别输进Qwen2.5-VL(用来控制图片要表达的意思)和VAE Encoder(用来控制图片的样子),这样模型改图片时,既能明白你想要改什么意思,又能保证图片看起来和原来差不多。

Qwen-Image-Edit使用场景

  • IP创作:可以基于一个角色做出不同的内容,比如把Qwen的吉祥物卡皮巴拉做成MBTI表情包。

  • 视角转换:能让物体转90度、180度。

  • 风格迁移:能把人物头像换成吉卜力动画那种风格。

如何用Qwen-Image-Edit做风格迁移的步骤

  1. 先去Qwen Chat(chat.qwen.ai)点“图像编辑”功能。

  2. 然后上传你想改风格的图片到编辑界面。

  3. 接着在提示词里写清楚想换成什么风格,比如“把这张人物头像换成吉卜力风格”。

  4. 再点提交,模型就会开始处理。

  5. 处理好后,能看到改完的图片,能下载下来。

如何用Qwen-Image-Edit做风格迁移的步骤

Qwen-Image-Edit模型下载地址:

  • ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit

  • Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit

  • GitHub:https://github.com/QwenLM/Qwen-Image


收藏
#吉卜力AI图片生成器
最新工具
豆包输入法
豆包输入法

字节跳动旗下“豆包”AI生态推出的官方中文输入法,主打“AI语音...

超级编导
超级编导

给短视频创作者和企业用的AI智能化批量剪辑与创意生产平台,主打高...

WormsZone.io
WormsZone.io

一个玩法和贪吃蛇差不多的多人实时IO小游戏,也叫“蠕虫大作战”“...

Slithercraft.io
Slithercraft.io

多人网页小游戏,混了贪吃蛇、我的世界和俄罗斯方块的感觉。玩法是吃...

Creatur.io
Creatur.io

一款在线多人吃尾巴对战IO游戏,游戏玩法围绕"吞噬进化...

InsCode快马
InsCode快马

一个AI驱动的在线开发平台,主打“一句话/一个链接,几分钟生成可...

Thea AI
Thea AI

一个专门为学生设计的AI学习平台。它能自动把课堂笔记、PDF文件...

Pose Search
Pose Search

一个开源的人体姿势搜索工具,允许用户根据性别、关节或身体部位来筛...

Linnk AI
Linnk AI

面向研究人员和专业人士的工具,能在网页、PDF 及多种文档里快速...

Mentimeter
Mentimeter

一个让传统演示变得更有趣、更互动的工具。它特别适合用在教育、企业...