
帖子
引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。
相关快讯
「光子股神」:英伟达入股助力诺基亚转型AI基础设施,近一个月内部人士积极增持
年化营收猛增至6亿美元,AI推理服务商Baseten拟以110亿美元估值融资10亿美元
「英伟达挑战者」Cerebras上线两周回落35.8%,链上CBRS最大空头盈达126万美元
高通与字节跳动达成数百万颗AI芯片采购协议
多家加密公司有望被纳入罗素指数,Bitmine与Galaxy或进入罗素1000
市场再传马斯克或整合SpaceX与特斯拉,双方AI与供应链协同持续加深
「新股神」Serenity评美光市值破万亿:下一个英伟达,2027年目标1.5万亿美元
拉满! 瑞银王牌分析师喊出美光华尔街最高目标价1625美元,为AI内存注入最强催化剂
AI 模型聚合平台 OpenRouter 完成 1.13 亿美元 B 轮融资,CapitalG 领投
「新股神」Serenity对SIVE一往情深:第191次喊单称其为最具吸引力CPO概念股