陈青云小说全集,许愿左占小说全文免费阅读

通義千問(wèn)首個(gè)文生圖模型開源：破解AI圖像生成“寫字”難題，復(fù)雜中英文渲染效果驚艷

鳳凰網(wǎng)科技

2025-08-05 10:30:20

鳳凰網(wǎng)科技訊 8月5日，通義千問(wèn)官方宣布開源一個(gè)20B的MMDiT模型Qwen-Image，這是通義千問(wèn)系列中的首個(gè)圖像生成基礎(chǔ)模型，在復(fù)雜文本渲染和精確圖像編輯方面進(jìn)展顯著。

該模型具備卓越的文本渲染能力、一致性的圖像編輯能力及強(qiáng)大的跨基準(zhǔn)性能表現(xiàn)。

在多個(gè)公開基準(zhǔn)測(cè)試中，包括GenEval、DPG、OneIG - Bench（通用圖像生成），GEdit、ImgEdit、GSO（圖像編輯）以及LongText - Bench、ChineseWord、TextCraft（文本渲染）等，Qwen-Image在各類生成與編輯任務(wù)中均獲得SOTA。

通義千問(wèn)首個(gè)文生圖模型開源：破解AI圖像生成“寫字”難題，復(fù)雜中英文渲染效果驚艷

在性能表現(xiàn)上，Qwen-Image能在不同場(chǎng)景中實(shí)現(xiàn)高保真文本渲染。例如，在海報(bào)制作中，它不僅能準(zhǔn)確展示海報(bào)風(fēng)格，還能保留人物姿勢(shì)和神態(tài)刻畫，準(zhǔn)確生成指定的中英文文字；在分模塊案例中，能完成排版并生成各部分的圖標(biāo)、標(biāo)題和介紹文本；除此之外，即使紙張面積小且段落文字長(zhǎng)，也能準(zhǔn)確生成文字，還可在雙語(yǔ)間靈活切換。

同時(shí)，Qwen-Image 在通用圖像生成方面支持多種藝術(shù)風(fēng)格，從照片級(jí)寫實(shí)到印象派繪畫，從動(dòng)漫風(fēng)格到極簡(jiǎn)設(shè)計(jì)，能靈活響應(yīng)創(chuàng)意提示。

通義千問(wèn)表示，希望Qwen-Image能進(jìn)一步推動(dòng)圖像生成領(lǐng)域發(fā)展，降低視覺(jué)內(nèi)容創(chuàng)作技術(shù)門檻，激發(fā)更多創(chuàng)新應(yīng)用可能，同時(shí)期待社區(qū)積極參與和反饋，共同構(gòu)建開放、透明、可持續(xù)發(fā)展的生成式AI生態(tài)。

目前，該模型已在魔搭社區(qū)與Hugging Face開源。

上一篇：夸克AI，攻入百度腹地

下一篇：沒(méi)有了

无码中文字幕av免费放