Posteo

引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网
币界网
币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。

Deslinde de responsabilidades: el contenido de OKX Orbit se brinda únicamente con fines informativos. Más información

Respuestas

Aún no hay comentarios. ¡Envía la primera respuesta!

Related Flash News

BlockbeatsHace 1 min

"Photon Stock God": La inversión de Nvidia ayuda a Nokia a transformarse en infraestructura de IA, con personas internas aumentando activamente sus participaciones durante el último mes

币界网Hace 2 h

Los ingresos anualizados se dispararon hasta 600 millones de dólares, y el proveedor de servicios de inferencia de IA Baseten planea recaudar 1.000 millones de dólares con una valoración de 11.000 millones

BlockbeatsHace 3 h

El "challenger de Nvidia" Cerebras cayó un 35,8% en dos semanas tras su lanzamiento, con el mayor vendedor en corto de CBRS en cadena obteniendo 1,26 millones de dólares

币界网Hace 5 h

Qualcomm y ByteDance han llegado a un acuerdo para comprar millones de chips de IA

BlockbeatsHace 7 h

Se espera que varias empresas cripto se incluyan en el Russell Index, con Bitmine y Galaxy posiblemente participando en el Russell 1000

BlockbeatsHace 8 h

Los rumores del mercado sugieren que Musk podría fusionarse con SpaceX y Tesla, profundizando la colaboración entre IA y cadenas de suministro entre ambas partes

BlockbeatsHace 11 h

"El nuevo dios de la acción" Serenity predice que la capitalización de mercado de Micron superará el billón: el próximo Nvidia, que aspira a 1,5 billones de dólares para 2027

BlockbeatsHace 12 h

¡Cargado al máximo! El principal analista de UBS ha subido el precio objetivo más alto en Wall Street para Micron, con 1.625 dólares, inyectando el catalizador más potente en la memoria de IA

ChainCatcherHace 20 h

La plataforma de agregación de modelos de IA OpenRouter completó una ronda de financiación Serie B de 113 millones de dólares, liderada por CapitalG

BlockbeatsHace 1 d

"New Stock God" Serenity está profundamente comprometida con SIVE: tras su llamada de orden número 191, se le llama la acción conceptual CPO más atractiva