Qwen-Image 是阿里通義千問團隊于2025年發布的開源圖像生成模型,屬于Qwen系列的重要組成部分。該模型以20B(200億)參數規模構建,采用MMDiT架構,專注于復雜文本渲染和高精度圖像生成。Qwen-Image 在復雜文本渲染方面表現出色,尤其在中英文文本渲染、多語言支持、多字體、復雜布局和排版一致性方面具有顯著優勢。模型支持多種圖像生成和編輯功能,包括風格遷移、圖像編輯、細節增強、文字修改等,適用于海報設計、PPT制作、品牌營銷等專業場景。
Qwen-Image開源項目官網入口網址:https://github.com/QwenLM/Qwen-Image

Qwen-Image 的核心優勢在于其在文本渲染方面的卓越表現。它能夠精準生成復雜文本排版,支持多語言(包括中文和英文)、多字體、多行文本和復雜布局,且在多個基準測試中表現優異,如LongText-Bench和ChineseWord測試中表現領先。此外,Qwen-Image 支持圖像編輯功能,如風格遷移、對象添加/刪除、細節增強等,提供靈活的圖像生成和編輯能力。
Qwen-Image 采用開源協議(Apache 2.0),可通過Hugging Face、ModelScope等平臺使用,支持商用和研究用途。模型支持多種提示詞和結構化提示(如<|system|>和<|user_text|>),以引導模型生成更符合用戶需求的圖像。用戶可通過提示詞生成中英文內容,支持本地部署和云端使用,適合多種創意應用,如生成logo、海報、AI藝術字等。
Qwen-Image 是阿里通義千問團隊在2025年推出的革命性圖像生成模型,憑借其在復雜文本渲染、圖像生成和編輯方面的卓越表現,成為當前最先進的文本到圖像生成模型之一。
相關導航
暫無評論...