基石智算CoresHub 率先上線?20B 參數(shù)的 MMDiT 模型 Qwen-Image,該模型由阿里通義千問(wèn)團(tuán)隊(duì)開源。
作為 Qwen 系列的首個(gè)文生圖基礎(chǔ)模型,它在復(fù)雜文本渲染、精確圖像編輯、多行布局、段落級(jí)生成以及細(xì)節(jié)刻畫方面表現(xiàn)亮眼;不論是通用圖像生成還是多種藝術(shù)風(fēng)格、高級(jí)編輯操作,它都能輕松駕馭,在海報(bào)設(shè)計(jì)場(chǎng)景中尤其出色?,F(xiàn)在,借助基石智算強(qiáng)大的算力支持與便捷的平臺(tái)服務(wù),用戶能夠快速體驗(yàn)到 Qwen-Image 的魅力,將創(chuàng)意高效轉(zhuǎn)化為現(xiàn)實(shí)。
模型亮點(diǎn)?
超強(qiáng)文本渲染能力:Qwen-Image 在復(fù)雜文本生成與渲染方面表現(xiàn)出眾,支持多行排版、段落級(jí)布局及細(xì)粒度細(xì)節(jié)呈現(xiàn),無(wú)論是英文還是中文,都能實(shí)現(xiàn)高度保真的視覺(jué)輸出。
圖像編輯一致性:依托強(qiáng)化的多任務(wù)訓(xùn)練范式,Qwen-Image 在圖像編輯過(guò)程中能夠精準(zhǔn)修改目標(biāo)區(qū)域,同時(shí)保持整體畫面的視覺(jué)一致性與語(yǔ)義連貫性。
行業(yè)SOTA 性能:多項(xiàng)公開基準(zhǔn)測(cè)試結(jié)果顯示,Qwen-Image 在多種圖像生成與編輯任務(wù)中均取得了業(yè)內(nèi)頂尖(SOTA)的成績(jī),充分驗(yàn)證了其卓越的綜合實(shí)力。
使用步驟
1.登錄 coreshub.cn,進(jìn)入模型廣場(chǎng),選擇 Qwen-Image 模型,點(diǎn)擊模型部署。
2.開始部署模型,資源類型選擇單卡 4090D 即可,立即部署模型,待模型部署成功后,復(fù)制外網(wǎng)鏈接到瀏覽器打開。


3.等待 ComfyUI 頁(yè)面加載成功后,選擇 Qwen-Image 模板,在框中輸入你的提示詞,點(diǎn)擊運(yùn)行,即可開始生成圖片。


效果展示
一起來(lái)感受下 Qwen-Image 的魅力吧。
提示詞:一只戴著牛仔帽的柴犬站在西部酒吧門口,嘴里叼著的木牌上用歪歪扭扭的手寫體寫著 “今天不營(yíng)業(yè),去追羊啦”,背景的酒桶上還有褪色的英文標(biāo)語(yǔ) “Best Whiskey”。

提示詞:漂浮在云端的棉花糖城堡,城堡大門是用曲奇餅干做的,上面用融化的巧克力寫著 “甜夢(mèng)入口處”,城門兩側(cè)的棒棒糖立柱上纏著彩色糖紙,上面印著迷你英文字母 “Welcome”。

提示詞:復(fù)古街機(jī)廳里,一臺(tái)像素風(fēng)格的游戲機(jī)屏幕亮著,游戲畫面里的主角舉著一塊霓虹燈牌,牌上是閃著藍(lán)光的中文 “通關(guān)秘籍:點(diǎn)贊收藏”,機(jī)器側(cè)面的貼紙還有模糊的日文 “最高のゲーム”。

欣賞了 Qwen-Image 驚艷的文生圖效果,你是不是也想試一試?那就快來(lái)基石智算(coreshub.cn),開始你的 AI 創(chuàng)作吧。