
豆包視頻生成大模型發(fā)布:首次突破多主體互動(dòng)難關(guān)
據(jù)媒體報(bào)道,字節(jié)跳動(dòng)正式宣告進(jìn)軍AI視頻生成。發(fā)布豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型發(fā)布,面向企業(yè)市場(chǎng)開啟邀測(cè)。
“豆包視頻生成”大模型憑借其卓越的語義理解能力、對(duì)復(fù)雜交互畫面的精準(zhǔn)捕捉以及多鏡頭切換下的內(nèi)容一致性,成功躋身業(yè)界先進(jìn)水平。
該模型不僅能夠深度理解并響應(yīng)復(fù)雜指令,驅(qū)動(dòng)不同人物角色完成一系列精細(xì)的動(dòng)作互動(dòng),更在細(xì)節(jié)處理上達(dá)到了極致,從人物樣貌、服裝的微妙變化到頭飾的精準(zhǔn)呈現(xiàn),均能在不同運(yùn)鏡角度下保持高度一致,仿佛實(shí)拍般自然流暢。
值得一提的是,“豆包視頻生成”模型依托字節(jié)跳動(dòng)自主研發(fā)的DiT(Dynamic Integration Transformer)架構(gòu),通過高效的DiT融合計(jì)算單元,實(shí)現(xiàn)了視頻在大動(dòng)態(tài)場(chǎng)景與多樣運(yùn)鏡之間的無縫切換。這一技術(shù)突破賦予了視頻變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語言能力,讓視頻創(chuàng)作更加自由靈動(dòng),滿足了創(chuàng)作者對(duì)視覺表達(dá)的無限想象。
為了進(jìn)一步提升視頻創(chuàng)作的專業(yè)性和觀賞性,“豆包視頻生成”團(tuán)隊(duì)還創(chuàng)新性地采用了全新設(shè)計(jì)的擴(kuò)散模型訓(xùn)練方法。
這一方法有效攻克了多鏡頭切換過程中保持主體、風(fēng)格、氛圍一致性的技術(shù)難題,確保在鏡頭切換的瞬間,視頻的整體氛圍與細(xì)節(jié)表現(xiàn)依然和諧統(tǒng)一,為觀眾帶來更加沉浸式的觀看體驗(yàn)。
目前,“豆包視頻生成”系列模型已在即夢(mèng)AI內(nèi)測(cè)版中開啟小范圍測(cè)試,旨在收集寶貴的用戶反饋,不斷優(yōu)化產(chǎn)品性能。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/

隨時(shí)掌握互聯(lián)網(wǎng)精彩
- 1 中美完全可以相互成就、共同繁榮 7904135
- 2 加沙已變“死城” 7809738
- 3 暴雨中臺(tái)下只剩1名觀眾 演員仍開演 7713069
- 4 近距離感受“大國重器” 7616508
- 5 美國大豆中國訂單量仍為零 7520884
- 6 試管嬰兒患腎病 父母要求醫(yī)院擔(dān)全責(zé) 7425630
- 7 女子婚后起訴父母返還18萬彩禮 7331925
- 8 網(wǎng)紅“戶晨風(fēng)”多平臺(tái)賬號(hào)被封 7235084
- 9 金價(jià)飆升 有非法淘金人井下生活兩年 7137689
- 10 特朗普升級(jí)辦公室:肉眼可見全是黃金 7042358