
帖子
万亿参数开源模型跑出981词/秒,Cerebras测试KimiK2.6提速29倍

币界网消息,Cerebras宣布在企业测试中上线万亿参数大模型Kimi K2.6,通过直接在整张12英寸硅晶圆上集成芯片,彻底消除了传统板级通信的互联延迟。第三方评测机构Artificial Analysis实测显示,其生成速度达到981 tokens/s,比主流GPU云服务快6.7倍。在10000输入、500输出token的长文本任务中,总响应耗时从Kimi官方接口的163.7秒缩短至5.6秒,提速达29倍。由于模型权重被分配到多个晶圆中流式传输激活值,层间通信完全运行在晶圆内部的网络织网上,其物理通信带宽达到英伟达NVL72架构中NVLink的200倍以上。配合分布式计算优化,Kimi K2.6以原始的4-bit权重进行低损存储,计算时使用16-bit浮点数维持精度,并采用定制算子内核与推测性解码最终达成实时化运行。
相关快讯
派盾:StakeDAO合约现无限铸币漏洞,攻击者已将部分资产跨链至以太坊
主力空军「pension-usdt.eth」时隔两月首次撤仓空单,账户净浮亏仍达700万美元
何一入选《财富》「商界最具影响力女性」榜单
StakeDAO部署者私钥在Arbitrum上遭泄露,攻击者铸造约5.45万亿枚vsdCRV并兑换为ETH
htx平台相关地址遭部分安全机构风险标签处理
数据:Circle 于 Solana 铸造 5 亿枚 USDC
布伦特原油日内跌幅扩大至3.00%
分析师:市场低迷之际,另有资金暗中积累山寨币
Hyperscale Data增持7.68枚BTC,总持仓达699.68枚
伊朗:根据美伊初步协议草案,美将在所有战线停火60天