Публикация

万亿参数开源模型跑出981词/秒,Cerebras测试KimiK2.6提速29倍

币界网
币界网
币界网消息,Cerebras宣布在企业测试中上线万亿参数大模型Kimi K2.6,通过直接在整张12英寸硅晶圆上集成芯片,彻底消除了传统板级通信的互联延迟。第三方评测机构Artificial Analysis实测显示,其生成速度达到981 tokens/s,比主流GPU云服务快6.7倍。在10000输入、500输出token的长文本任务中,总响应耗时从Kimi官方接口的163.7秒缩短至5.6秒,提速达29倍。由于模型权重被分配到多个晶圆中流式传输激活值,层间通信完全运行在晶圆内部的网络织网上,其物理通信带宽达到英伟达NVL72架构中NVLink的200倍以上。配合分布式计算优化,Kimi K2.6以原始的4-bit权重进行低损存储,计算时使用16-bit浮点数维持精度,并采用定制算子内核与推测性解码最终达成实时化运行。

Дисклеймер: контент OKX Orbit предоставляется исключительно в информационных целях. Подробнее

Ответы

Комментариев еще нет. Будьте первым!

Related Flash News

Blockbeats8 ч. назад

«Photon Stock God»: Инвестиции Nvidia помогают Nokia трансформироваться в инфраструктуру ИИ, при этом инсайдеры активно увеличивают свои активы за последний месяц

币界网10 ч. назад

Представляя поиск AlphaGo, новый фреймворк MCTS для генерации видео, предлагающий более длинные видео, чем Sora.

币界网10 ч. назад

Годовая выручка выросла до 600 миллионов долларов, а поставщик услуг инференции ИИ Baseten планирует привлечь 1 миллиард долларов при оценке в 11 миллиардов долларов

Blockbeats12 ч. назад

Cerebras «Nvidia-челленджер» упал на 35,8% за две недели после запуска, а крупнейший онлайн-сетевой шортселлер CBRS заработал $1,26 миллиона

币界网13 ч. назад

Qualcomm и ByteDance достигли соглашения о покупке миллионов чипов на базе искусственного интеллекта

Blockbeats15 ч. назад

Ожидается, что несколько криптокомпаний будут включены в индекс Russell, а Bitmine и Galaxy могут войти в список Russell 1000

Blockbeats17 ч. назад

Слухи на рынке предполагают, что Маск может слиться со SpaceX и Tesla, при этом сотрудничество в области ИИ и цепочки поставок между двумя сторонами углубится

Blockbeats19 ч. назад

«Новый Бог акций» Serenity прогнозирует, что рыночная капитализация Micron превысит один триллион: следующая Nvidia, целясь на $1,5 триллиона к 2027 году

Blockbeats20 ч. назад

Загружен до максимума! Ведущий аналитик UBS повысил самую высокую целевую цену Micron на Уолл-стрит до $1 625, что стало самым сильным катализатором в памяти ИИ

ChainCatcher1 д. назад

Платформа для агрегации моделей ИИ OpenRouter завершила раунд финансирования серии B на сумму 113 миллионов долларов под руководством CapitalG