
LONGLIVE – 英偉達(dá)等推出的交互式長視頻生成框架
LONGLIVE是什么
LONGLIVE 是英偉達(dá)等頂尖機(jī)構(gòu)聯(lián)合推出的實(shí)時(shí)交互式長視頻生成框架??蚣芡ㄟ^幀級(jí)自回歸(AR)模型,結(jié)合 KV-recache 機(jī)制、流式長視頻微調(diào)和短窗口注意力 + 幀匯入技術(shù),解決長視頻生成中效率和質(zhì)量的雙重瓶頸。LONGLIVE 能在單個(gè) H100 GPU 上以 20.7 FPS 的速度生成長達(dá) 240 秒的高質(zhì)量視頻,支持實(shí)時(shí)提示詞切換和動(dòng)態(tài)調(diào)整,為創(chuàng)意、教育和影視等領(lǐng)域開辟了新的創(chuàng)作可能性,是推動(dòng) AI 視頻生成從“玩具”走向“生產(chǎn)力工具”的關(guān)鍵一步。
LONGLIVE的主要功能
- 實(shí)時(shí)交互:支持用戶在視頻生成過程中實(shí)時(shí)輸入流式提示詞(prompt),動(dòng)態(tài)調(diào)整視頻內(nèi)容,引導(dǎo)敘事或改變風(fēng)格。
- 長視頻生成:模型能生成長達(dá)數(shù)分鐘的高質(zhì)量視頻,支持復(fù)雜的敘事和場(chǎng)景發(fā)展。
- 高效推理:在單個(gè) NVIDIA H100 GPU 上達(dá)到 20.7 FPS 的實(shí)時(shí)速度,支持長達(dá) 240 秒的視頻生成,同時(shí)保持高保真度和時(shí)間連續(xù)性。
- 高質(zhì)量生成:通過創(chuàng)新技術(shù)確保生成視頻的視覺連貫性和語義一致性,在頻繁切換提示詞時(shí)能保持平滑過渡。
- 低部署成本:支持 INT8 量化推理,進(jìn)一步降低模型大小和部署成本,幾乎不損失性能。
LONGLIVE的技術(shù)原理
KV-recache 機(jī)制:在切換提示詞時(shí),通過重新計(jì)算鍵值(KV)緩存“刷新”狀態(tài),清除舊提示詞的殘留信息,同時(shí)保留視覺和運(yùn)動(dòng)線索,確保畫面平滑過渡并精準(zhǔn)執(zhí)行新指令。將 recache 操作整合到訓(xùn)練中,使模型在訓(xùn)練時(shí)就學(xué)會(huì)如何在提示詞切換后平滑過渡。
流式長視頻微調(diào)(Streaming Long Tuning):解決自回歸(AR)模型在長視頻生成中的質(zhì)量衰減問題,通過“滾動(dòng)擴(kuò)展”的方式模擬推理過程,減少訓(xùn)練與推理的不一致性。用局部監(jiān)督和梯度分離,避免長序列反向傳播導(dǎo)致的內(nèi)存溢出(OOM)問題,確保教師模型的可靠監(jiān)督。
短窗口注意力 + 幀匯入(Frame Sink):基于短窗口注意力,將注意力范圍限制在局部窗口內(nèi),顯著降低計(jì)算復(fù)雜度和內(nèi)存需求。引入幀匯入機(jī)制,通過保留全局錨點(diǎn)(如視頻的第一幀塊),恢復(fù)長程一致性,同時(shí)保持短窗口的高效性。
LONGLIVE的項(xiàng)目地址
GitHub倉庫:https://github.com/NVlabs/LongLive
HuggingFace模型庫:https://huggingface.co/Efficient-Large-Model/LongLive-1.3B
arXiv技術(shù)論文:https://arxiv.org/pdf/2509.22622
LONGLIVE的應(yīng)用場(chǎng)景
- 創(chuàng)意視頻制作:創(chuàng)作者能實(shí)時(shí)調(diào)整視頻內(nèi)容和風(fēng)格,快速生成符合創(chuàng)意需求的長視頻,提升創(chuàng)作效率和靈活性。
- 教育內(nèi)容生成:教師根據(jù)教學(xué)進(jìn)度實(shí)時(shí)生成教學(xué)視頻,動(dòng)態(tài)插入知識(shí)點(diǎn)或案例,增強(qiáng)教學(xué)互動(dòng)性和趣味性。
- 影視制作:導(dǎo)演和編劇能在拍攝前實(shí)時(shí)預(yù)覽不同場(chǎng)景和敘事路徑,快速調(diào)整劇本和拍攝計(jì)劃,降低制作成本。
- 廣告創(chuàng)作:廣告團(tuán)隊(duì)能根據(jù)客戶需求實(shí)時(shí)生成廣告視頻,快速調(diào)整創(chuàng)意方向,提高廣告的針對(duì)性和吸引力。
- 游戲開發(fā):開發(fā)者能實(shí)時(shí)生成游戲過場(chǎng)動(dòng)畫或動(dòng)態(tài)背景,根據(jù)游戲劇情實(shí)時(shí)調(diào)整內(nèi)容,提升玩家沉浸感。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/

隨時(shí)掌握互聯(lián)網(wǎng)精彩
- 1 總書記的“家常話”格外暖心 7904333
- 2 妻子抄起油桶砸丈夫 網(wǎng)友卻一致好評(píng) 7808982
- 3 賣不完的月餅都去哪兒了 7712542
- 4 中秋遇國慶 祝愿家國共團(tuán)圓 7617160
- 5 收花生找到姥姥丟了12年的金鐲子 7521572
- 6 波蘭女子只吃水果 去世前體重僅44斤 7425236
- 7 網(wǎng)警提醒:假期過半安全不松懈 7329883
- 8 航天員的中秋大餐吃啥?菜品曝光 7235973
- 9 核電站竟然還有產(chǎn)珍珠的副業(yè) 7137476
- 10 牛彈琴:這場(chǎng)血腥戰(zhàn)爭終于打不下去了 7039363