首页 > Ai资讯 > Ai产品

Qwen VLo：阿里巴巴推出的多模态统一理解与生成模型

Qwen VLo于2025-06-28发布在Ai产品

Qwen VLo是什么？

Qwen VLo是阿里云通义千问在2025年6月27日推出的多模态模型，支持图像生成与编辑、风格转换、复杂指令执行、多图理解生成、图像检测标注及文本直接生图等功能。

核心功能

高质量生图与编辑：能根据文字或图片提示生成、修改图像，支持逐步构建复杂场景、实时调整，可用简单指令生成多语言图片。
动态分辨率适配：采用动态分辨率技术，可生成适合海报、插画、网页横幅、社交媒体封面等不同场景的图片。
渐进式生成：从左到右、从上到下逐步构建图像，生成中持续优化内容，确保画面和谐统一。
开放指令编辑：支持用自然语言提创意需求，如“改梵高风格”“做成19世纪老照片”“加晴朗天空”，模型能灵活响应并输出符合预期的结果。
多语言指令：支持中文、英文等多种语言指令，方便全球用户使用。

技术特点

视觉语言深度融合：能理解画面内容并进行高质量再创作，生成时保持语义一致，细节捕捉能力强。
强视觉编辑能力：可处理复杂编辑指令，在单条指令中完成多类修改，同时确保主体结构和上下文准确。

应用场景

设计与创意：为设计师、营销人员、教育工作者提供工具，支持艺术风格转换、场景重构、细节优化等，助力快速实现创意。
多语言内容创作：满足不同语言背景用户的内容生产需求。

此外，Qwen VLo的输入和输出均支持任意分辨率与长宽比的图片，适配多种使用场景。用户可实时查看生成过程并调整。目前该模型仍在预览阶段。

常见问题

问题1：Qwen VLo在生成能力上比之前的多模态模型强在哪里？

答：Qwen VLo的优势在于：细节捕捉更精准，生成内容语义连贯；能响应艺术风格转换等创意指令，完成复杂任务；渐进式生成机制让视觉效果更好，创作更灵活。

问题2：Qwen VLo能进行哪些图像操作？

答：Qwen VLo可以：直接生成图像；修改图像，如换背景、加元素；转换风格，比如吉卜力风、3D风；进行图像感知定位，像检测、分割；处理多操作复杂指令，完成多步骤任务；生成动态比例图像（极端比例功能尚未推出）；再理解自身生成内容，例如识别动物品种。

问题3：Qwen VLo预览阶段有哪些局限？

答：预览阶段，Qwen VLo可能出现生成不准确、与原图不符、不符合指令、意图理解不稳定等问题。

博客：https://qwenlm.github.io/blog/qwen-vlo/

StyleList：一款开源的AI试衣工具

MultiAgentPPT：一款集成A2A+MCP + ADK的PPT智能生成系统

Qwen-Image-Edit：通义千问推出的图像编

Qwen-Image-Edit：通义千问推出的图像编

2025-08-19

Qwen-Image：阿里云通义千问团队开源的图形海

Qwen-Image：阿里云通义千问团队开源的图形海

2025-08-06

ColQwen-Omni：一款开源的多模态RAG模型

ColQwen-Omni：一款开源的多模态RAG模型

2025-07-19

阿里推出QwenLong-L1-32B：一款用于长上

阿里推出QwenLong-L1-32B：一款用于长上

2025-05-27

Qwen官网上线Web Dev功能，不会代码也能创建

Qwen官网上线Web Dev功能，不会代码也能创建

2025-05-11

阿里推出最新模型Qwen3：支持两种思考模式，具备多

阿里推出最新模型Qwen3：支持两种思考模式，具备多

2025-04-29

最新工具

Forvo

一个全球语言发音学习平台，提供超450种语言的真人发音资源，包括...

Animon AI

全球首款专为动漫设计的AI视频生成平台。它的特点是“上传一张插画...

TheStocks.IM

一个综合性设计素材资源与工具聚合平台，汇集了包括 Unsplas...

WeaveSilk

一个在线光线艺术绘画工具，直接用鼠标在画布上画图案就能生成对称又...

Aice PS

网页版AI照片编辑器，利用Google aistudio的的先进...

FlightRadar24

一个实时航班追踪工具。它把谷歌地图、航空信息，还有 ADS-B、...

VeeSpark

一个能做AI内容生成的平台，主要帮人通过文字或图片快速做出视频和...

Hitem3D AI

Math Magic公司开发的工具，用他们自研的高精度AI模型S...

Tools.Dverso.io

一个带洗衣游戏感的在线抠图工具，是个能去掉图片背景的网站，它的特...

Neural4D

一个专注3D动态场景生成与交互的创新平台，核心是用人工智能技术把...

用户登录

Qwen VLo：阿里巴巴推出的多模态统一理解与生成模型

Qwen VLo是什么？

核心功能

技术特点

应用场景

常见问题

相关文章

最新文章

最新工具