Qwen-Image-Edit:通义千问推出的图像编辑模型,可以进行语义和外观双重编辑

Qwen-Image-Edit是通义千问推出的图像编辑模型,它在20B参数的Qwen-Image模型基础上进一步训练而来,能同时处理图片里的语义和外观修改,比如精准改图片上的文字,还能做IP形象创作、换风格等操作,在多个公开测试里表现是最好的,已经在ModelScope、Hugging Face和GitHub上开源了。

Qwen-Image-Edit:通义千问推出的图像编辑模型,可以进行语义和外观双重编辑

Qwen-Image-Edit核心能力

  • 语义和外观都能改:把图片输进Qwen2.5-VL能控制图片要表达的意思,输进VAE Encoder能控制图片的样子。用这个能力可以做IP形象创作、让物体转方向、换图片风格,也能给图片加东西、删东西、重新画。

  • 改文字很准:中英文文字都能改,在不改原来字体、大小、风格的情况下,能给图片里的文字加内容、删内容、改内容,还能改特定文字的颜色。

  • 测试表现好:在多个公开测试里达到了目前最好的效果。

Qwen-Image-Edit技术

  • 一个是多任务训练。用了改进的多任务训练方法,把传统的文字生成图片、文字加图片生成新图片、图片生成新图片这些任务结合起来,让Qwen2.5-VL和MMDiT这两个部分的隐藏信息能更好地对应上。

  • 另一个是双重编码。把图片分别输进Qwen2.5-VL(用来控制图片要表达的意思)和VAE Encoder(用来控制图片的样子),这样模型改图片时,既能明白你想要改什么意思,又能保证图片看起来和原来差不多。

Qwen-Image-Edit使用场景

  • IP创作:可以基于一个角色做出不同的内容,比如把Qwen的吉祥物卡皮巴拉做成MBTI表情包。

  • 视角转换:能让物体转90度、180度。

  • 风格迁移:能把人物头像换成吉卜力动画那种风格。

如何用Qwen-Image-Edit做风格迁移的步骤

  1. 先去Qwen Chat(chat.qwen.ai)点“图像编辑”功能。

  2. 然后上传你想改风格的图片到编辑界面。

  3. 接着在提示词里写清楚想换成什么风格,比如“把这张人物头像换成吉卜力风格”。

  4. 再点提交,模型就会开始处理。

  5. 处理好后,能看到改完的图片,能下载下来。

如何用Qwen-Image-Edit做风格迁移的步骤

Qwen-Image-Edit模型下载地址:

  • ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit

  • Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit

  • GitHub:https://github.com/QwenLM/Qwen-Image


收藏
#吉卜力AI图片生成器
最新工具
ToonComposer
ToonComposer

腾讯推出的AI自动上色和生成动画工具,它能将动画制作里“补帧”和...

YUME.LY
YUME.LY

一个梦境的记录与分享网站,用户能记下自己遇到的奇怪、荒诞或奇幻的...

CXTVLive
CXTVLive

一个能免费看全球电视频道和实时摄像头的网站。CXTVLive上面...

你好星识
你好星识

一个新的AI智能文本工作空间,能把知识库、文档、表格、PPT、录...

Open Lovable
Open Lovable

一个快速转换网站为React/Next.js应用的免费开源工具。...

ScreenCoder
ScreenCoder

一个能把任意设计截图转换成结构清晰、可编辑的 HTML/CSS ...

中国家谱知识服务平台
中国家谱知识服务平台

一个免费的家谱在线查询网站,是上海图书馆利用数字人文方法和关联数...

Klic Studio
Klic Studio

Krillin AI推出的视频翻译和配音工具,它支持100多种语...

陪读蛙
陪读蛙

一款开放源代码的沉浸式翻译浏览器扩展,可以帮助您从任何网站深入学...

QuickRiddle
QuickRiddle

一个免费在线多人联机益智游戏平台,有贪吃蛇、2048、俄罗斯方块...