
USO – 字節(jié)跳動(dòng)推出的內(nèi)容與風(fēng)格解耦與重組統(tǒng)一框架
聲明:該文章來自(AI工具集)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
USO是什么
USO(Unified Style-Subject Optimized)是字節(jié)跳動(dòng) UXO 團(tuán)隊(duì)推出的內(nèi)容與風(fēng)格解耦與重組統(tǒng)一框架。能將任何主題與任何風(fēng)格在任何場(chǎng)景中自由組合,生成具有高度主體一致性、強(qiáng)烈風(fēng)格保真度且自然、非塑料感的圖像。USO 通過構(gòu)建大規(guī)模三元組數(shù)據(jù)集,采用解耦學(xué)習(xí)方案同時(shí)對(duì)齊風(fēng)格特征并分離內(nèi)容與風(fēng)格,引入風(fēng)格獎(jiǎng)勵(lì)學(xué)習(xí)(SRL)來進(jìn)一步提升模型性能。USO 發(fā)布了 USO-Bench 基準(zhǔn)測(cè)試,用于綜合評(píng)估風(fēng)格相似性和主體保真度。實(shí)驗(yàn)表明,USO 在主體一致性和風(fēng)格相似性兩個(gè)維度上均達(dá)到了開源模型的頂尖水平。
USO的主要功能
- 風(fēng)格與主體融合:能將任意主題與任意風(fēng)格自由組合,生成既保留主體特征又符合指定風(fēng)格的圖像,解決了風(fēng)格與主體難以融合的問題。
- 高保真度生成:在生成圖像時(shí),能保持高度的主體一致性和風(fēng)格保真度,確保生成的圖像自然且具有高質(zhì)量。
- 多場(chǎng)景應(yīng)用:適用于多種場(chǎng)景,可廣泛應(yīng)用于藝術(shù)創(chuàng)作、廣告設(shè)計(jì)、游戲開發(fā)等領(lǐng)域。
- 開源支持:項(xiàng)目全面開源,包括訓(xùn)練代碼、推理腳本、模型權(quán)重和數(shù)據(jù)集,為研究者和開發(fā)者提供了豐富的資源。
- 性能領(lǐng)先:在主體一致性和風(fēng)格相似性兩個(gè)維度上均達(dá)到了開源模型的頂尖水平,通過大規(guī)模三元組數(shù)據(jù)集和解耦學(xué)習(xí)方案實(shí)現(xiàn)性能提升。
- 基準(zhǔn)測(cè)試:發(fā)布了 USO-Bench 基準(zhǔn)測(cè)試,用于綜合評(píng)估風(fēng)格相似性和主體保真度,為后續(xù)模型提供統(tǒng)一的比拼標(biāo)準(zhǔn)。
USO的技術(shù)原理
- 大規(guī)模三元組數(shù)據(jù)集構(gòu)建:創(chuàng)建了包含內(nèi)容圖像、風(fēng)格圖像和對(duì)應(yīng)風(fēng)格化圖像的三元組數(shù)據(jù)集,為模型訓(xùn)練提供了豐富的數(shù)據(jù)基礎(chǔ)。
- 解耦學(xué)習(xí)方案:通過風(fēng)格對(duì)齊訓(xùn)練和內(nèi)容 – 風(fēng)格解耦訓(xùn)練兩個(gè)階段,同時(shí)對(duì)齊風(fēng)格特征并分離內(nèi)容與風(fēng)格,避免特征串?dāng)_,實(shí)現(xiàn)精準(zhǔn)融合。
- 風(fēng)格獎(jiǎng)勵(lì)學(xué)習(xí)(SRL):引入獎(jiǎng)勵(lì)信號(hào)優(yōu)化生成質(zhì)量,平衡風(fēng)格相似性與主體一致性,進(jìn)一步提升模型性能。
- 統(tǒng)一框架:將風(fēng)格驅(qū)動(dòng)和主體驅(qū)動(dòng)兩類任務(wù)合并到單一模型框架中,解決了傳統(tǒng)方法中兩者對(duì)立的問題,實(shí)現(xiàn)了風(fēng)格與主體的協(xié)同優(yōu)化。
- 兩階段訓(xùn)練流程:第一階段通過風(fēng)格對(duì)齊訓(xùn)練使模型具備風(fēng)格復(fù)現(xiàn)能力;第二階段通過內(nèi)容 – 風(fēng)格解耦訓(xùn)練實(shí)現(xiàn)聯(lián)合條件生成,最終通過風(fēng)格獎(jiǎng)勵(lì)學(xué)習(xí)監(jiān)督整個(gè)訓(xùn)練過程。
USO的核心價(jià)值
提出了創(chuàng)新的協(xié)同解耦范式:打破了風(fēng)格和主體生成任務(wù)各自為戰(zhàn)的局面,證明了通過跨任務(wù)的聯(lián)合學(xué)習(xí)可以實(shí)現(xiàn)更徹底的內(nèi)容-風(fēng)格解耦,并相互促進(jìn)。
構(gòu)建了強(qiáng)大的統(tǒng)一生成模型:USO是首個(gè)在單一框架內(nèi)同時(shí)實(shí)現(xiàn)SOTA級(jí)別主體一致性和風(fēng)格相似性的模型,其效果和通用性都令人印象深刻。
引入了獎(jiǎng)勵(lì)學(xué)習(xí)增強(qiáng):將獎(jiǎng)勵(lì)學(xué)習(xí)范式成功應(yīng)用于風(fēng)格生成,為進(jìn)一步提升生成模型的精細(xì)控制力和美學(xué)質(zhì)量提供了有效途徑。
發(fā)布了首個(gè)聯(lián)合評(píng)估基準(zhǔn):USO-Bench填補(bǔ)了該領(lǐng)域在綜合評(píng)估上的空白,為后續(xù)研究提供了公平、全面的比較平臺(tái)。
USO的項(xiàng)目地址
項(xiàng)目官網(wǎng):https://bytedance.github.io/USO/
Github倉(cāng)庫:https://github.com/bytedance/USO
arXiv技術(shù)論文:https://arxiv.org/pdf/2508.18966
USO的模型效果
- 風(fēng)格遷移精準(zhǔn):能將不同風(fēng)格精準(zhǔn)地遷移到新的內(nèi)容上,生成的圖像在保留原始風(fēng)格的筆觸和色彩的同時(shí),不會(huì)使主體變形,風(fēng)格相似度高。
- 主體特征保留:在風(fēng)格變化時(shí),能鎖定主體特征,適配多種風(fēng)格,保持人物或物體的原樣,主體一致性好。
- 聯(lián)合生成能力強(qiáng):可以同時(shí)滿足風(fēng)格和主體的雙需求,一步生成既符合指定風(fēng)格又完整保留主體布局的圖像,實(shí)現(xiàn)風(fēng)格與主體的完美融合。
- 生成質(zhì)量高:在主體驅(qū)動(dòng)生成、風(fēng)格驅(qū)動(dòng)生成以及聯(lián)合風(fēng)格 – 主體驅(qū)動(dòng)生成任務(wù)上均取得了 SOTA(State-of-the-Art)效果,生成的圖像自然、逼真,具有高質(zhì)量。
- 適應(yīng)性強(qiáng):模型對(duì)不同的主體和風(fēng)格具有很強(qiáng)的適應(yīng)性,能夠處理多種類型的內(nèi)容,如人物、動(dòng)物、場(chǎng)景等,以及多種風(fēng)格,如油畫、水墨、漫畫等。
- 定量比較:在USO-Bench上,無論是在主體驅(qū)動(dòng)任務(wù)還是風(fēng)格驅(qū)動(dòng)任務(wù)中,USO的各項(xiàng)指標(biāo)(如CLIP-I, DINO, CSD)均顯著優(yōu)于現(xiàn)有的所有開源SOTA模型。在更具挑戰(zhàn)性的風(fēng)格-主體聯(lián)合驅(qū)動(dòng)任務(wù)上,USO同樣大幅領(lǐng)先,證明了其強(qiáng)大的統(tǒng)一生成能力。
USO的應(yīng)用場(chǎng)景
- 藝術(shù)創(chuàng)作:藝術(shù)家可以用USO將不同的藝術(shù)風(fēng)格應(yīng)用到同一主體上,快速生成多種風(fēng)格的草圖或成品,激發(fā)創(chuàng)作靈感,提高創(chuàng)作效率。
- 廣告設(shè)計(jì):廣告設(shè)計(jì)師可以借助USO根據(jù)不同的廣告主題和目標(biāo)受眾,快速生成具有特定風(fēng)格和主體特征的廣告圖像,提升廣告的吸引力和針對(duì)性。
- 游戲開發(fā):游戲開發(fā)者可以用USO為游戲角色和場(chǎng)景生成不同風(fēng)格的圖像,豐富游戲的視覺效果,增強(qiáng)游戲的沉浸感。例如,將游戲角色的外觀風(fēng)格從寫實(shí)風(fēng)格轉(zhuǎn)換為卡通風(fēng)格。
- 影視制作:在影視特效制作中,USO可以用于快速生成具有特定風(fēng)格的場(chǎng)景或角色形象,輔助特效師進(jìn)行創(chuàng)意構(gòu)思和效果預(yù)覽。比如,為一部科幻電影生成具有未來感風(fēng)格的角色形象。
- 教育領(lǐng)域:在藝術(shù)教育和設(shè)計(jì)教育中,USO可以作為教學(xué)工具,幫助學(xué)生更好地理解和掌握不同藝術(shù)風(fēng)格的特點(diǎn),以及如何將這些風(fēng)格應(yīng)用到實(shí)際創(chuàng)作中。例如,教師可以用USO展示同一幅作品在不同風(fēng)格下的表現(xiàn)。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/
- 1 中美完全可以相互成就、共同繁榮 7904034
- 2 加沙已變“死城” 7809358
- 3 暴雨中臺(tái)下只剩1名觀眾 演員仍開演 7714379
- 4 近距離感受“大國(guó)重器” 7618832
- 5 美國(guó)大豆中國(guó)訂單量仍為零 7519722
- 6 試管嬰兒患腎病 父母要求醫(yī)院擔(dān)全責(zé) 7424149
- 7 女子婚后起訴父母返還18萬彩禮 7329461
- 8 委內(nèi)瑞拉:美國(guó)“不宣而戰(zhàn)” 7234348
- 9 金價(jià)飆升 有非法淘金人井下生活兩年 7135491
- 10 網(wǎng)紅“戶晨風(fēng)”多平臺(tái)賬號(hào)被封 7045475