Postingan

引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网
币界网
币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。

Penafian: Konten OKX Orbit ini hanya disediakan untuk tujuan informasi. Selengkapnya

Balasan

Belum ada komentar. Jadilah yang pertama membalas!

Related Flash News

Tidak ada berita terkait