帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
Wintermute:宏观叙事转向加息预期,加密市场杠杆脆弱性凸显
分析:链上数据显示BTC连跌期间大资金尚未出逃,7.6万美元附近出现承接
BitGo Holdings于Q1增持776枚BTC,总持仓达2449枚
Vitalik:以太坊正在推进原生隐私,短期举措包括 AA 与 FOCIL 的结合等
Ark Invest逢低买入约440万美元Bullish股票,此前该股连跌五日
制造初创公司SendCutSend完成1.1亿美元融资,Paradigm等领投
财新:CRS 2.0将加密资产纳入全球税务“天眼”,境外征税全面趋严
哈佛加密持仓一年亏损超1.5亿美元,高点追涨BTC后清仓ETH
Kaiko收购Cometh扩展数字资产数据基础设施
美军加油机现身以色列机场


