当地时间3月24日,谷歌研究院发布TurboQuant压缩算法,瞬间搅动全球半导体市场。 这项号称“技术核弹”的突破,能将AI大模型KV缓存从16K无损压缩至3K,内存占用直降六分之五,在英伟达H100上4比特版本运算速度还能提升8倍。 消息一出,全球存储芯片板块集体跳水,美光、闪迪、三星、SK海力士等巨头市值一日蒸发超6200亿元,市场恐慌声四起,甚至断言半导体寒冬将至。 但这场大跌,本质是市场对技术边界的误读与短期情绪宣泄。 TurboQuant仅优化AI推理环节的缓存,与模型训练算力、市场紧缺的HBM高带宽内存毫无关联。 摩根士丹利、富国银行等机构火速发声,直指市场反应过度——该算法对比的是老旧32位模型,而行业早已普及4位量化技术,实际提升远被夸大。 从杰文斯悖论看,效率提升会催生更多应用场景,算法节省的内存会被更长对话、更复杂推理快速消耗。短期波动不改行业刚需,HBM依旧供不应求,高端算力芯片订单饱满,半导体长期上行趋势未变。


