
帖子
引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。
相關快訊
「光子股神」:英偉達入股助力諾基亞轉型AI基礎設施,近一個月內部人士積極增持
年化營收猛增至6億美元,AI推理服務商Baseten擬以110億美元估值融資10億美元
「英偉達挑戰者」Cerebras上線兩周回落35.8%,鏈上CBRS最大空頭盈達126萬美元
高通與位元組跳動達成數百萬顆AI晶元採購協定
多家加密公司有望被納入羅素指數,Bitmine與Galaxy或進入羅素1000
市場再傳馬斯克或整合SpaceX與特斯拉,雙方AI與供應鏈協同持續加深
「新股神」Serenity評美光市值破萬億:下一個英偉達,2027年目標1.5萬億美元
拉滿! 瑞銀王牌分析師喊出美光華爾街最高目標價1625美元,為AI記憶體注入最強催化劑
AI 模型聚合平臺 OpenRouter 完成 1.13 億美元 B 輪融資,CapitalG 領投
「新股神」Serenity對SIVE一往情深:第191次喊單稱其為最具吸引力CPO概念股