ued中国体育一天挥发6200亿!谷歌算法黑科武术溃存储股，华尔街痛批市集“不懂时期”

发布日期：2026-03-27 17:27 点击次数：83

从“算力期间”干涉“推理期间”，AI对内存的需求激增，大幅提振了巨匠存储公司事迹和股价。

但谷歌的一篇著述，让好意思国和韩国的内存巨头市值一天挥发了超900亿好意思元（约合东谈主民币6200亿元）。

当地时刻3月24日，谷歌商议院（Google Research）发布了一篇先容名为TurboQuant的向量量化压缩算法的著述，声称在不去世准确率前提下，将大模子运行时的环节内存占用压缩至3比特（原有内存占用的1/6）。

有市集不雅点以为，这一算法将减少AI对内存的需求。

但也有分析师称，市集的反应施展，好多东谈主对时期“一窍欠亨”。

谷歌发布新算法，存储巨头市值挥发逾6200亿元

当地时刻3月24日，谷歌发布名为TurboQuant的内存压缩算法。谷歌方面默示，TurboQuant不错在不去世准确性的情况下，将大型谈话模子运行时的环节部分——键值缓存（KV Cache）的内存占用减少为原有的1/6，同期在英伟达H100GPU上的特定测试中，性能可提高高达8倍。

这一讯息赶快触发市集重估逻辑。

富国银行分析师Andrew Rocha以为，这项时期可能影响改日对内存容量规格的需求判断。他在陈诉中写谈：“市集很快就会重新评估，AI究竟还需要若干内存容量。”

当地时刻3月25日，即讯息发布后的第一个好意思股往还日，存储芯片板块在盘中集体跳水。闪迪（SanDisk）股价一度大跌6.5%，收盘时跌幅收窄至3.5%，市值去世36.3亿好意思元。同日，好意思光科技（Micron Technology）着落3.4%，市值去世151.66亿好意思元；西部数据（Western Digital）着落1.63%，市值去世16.64亿好意思元；希捷科技（Seagate Technology）着落2.76%，市值去世21.4亿好意思元。

负面脸色赶快扩散至亚洲市集。3月26日，韩国SK海力士股价着落6.23%，市值去世44.18万亿韩元（约合293.8亿好意思元）；三星电子也着落了4.71%，市值去世57.83万亿韩元（约合384.5亿好意思元）。

巨匠主要内存巨头市值去世总共超900亿好意思元（约合东谈主民币6200亿元）。

直击大模子“资本痛点”：KV缓存占用减少83%

TurboQuant激发转动的中枢，在于其精确击中了大模子的环节资本痛点——KV缓存（Key-Value Cache）。

在大模子推理历程中，模子需要保存历史高下文信息造成KV缓存，以幸免叠加商量。但跟着高下文窗口增长，KV缓存呈线性推广，占用多量GPU内存。

举例，一个700亿参数模子在512用户、2048 Token输入场景下，仅KV缓存就需约512GB内存，约为模子试验的4倍，已成为生意化部署中的最大资本之一。

传统处分决策是“量化”，即用低精度数据替代高精度浮点数，但时时殉难准确率，且还需稀奇存储量化参数，对消部分压缩收益。

TurboQuant通过两步优化处分这一问题。

第一步，愚弄名为PolarQuant的标准，将数据从笛卡尔坐标休养为极坐标，近似于“向东走3米，向北走4米”的教唆，ued中国体育简化为“以37度角走5米”。通过随即旋转让数据漫衍可展望，从而无需稀奇量化参数，平直减少内存支拨。

第二步，再愚弄名为QJL（量化约翰逊-林登施特劳斯变换）的时期，用只是1个比特来修正第一步压缩后产生的细小瑕疵，确保最终杀青的准确性。

谷歌默示，通过该组合决策：

◆KV缓存可压缩至3比特，内存占用减少为原有的1/6（降幅约83%）；

◆在Gemma、Mistral等模子测试中，性能与未压缩模子一致，无需稀奇磨真金不怕火或微调；

◆在NVIDIA H100测试中，4比特TurboQuant注倡导商量速率达到32位未量化的8倍。

华尔街舌战：省俭缓存就是减少内存总需求吗？

尽管市集短期剧烈反应，但机构不雅点赫然分化。

率先，这项时期并非初度清楚，干系论文早在2025年4月已公开。

其次，有分析指出，谷歌所谓的“8倍性能提高”是与32位未量化模子对比得出，而面前主流已普遍禁受4位量化，试验提高或低于宣传值。

市集分析机构Citrini Research分析师Jukan直言，因TurboQuant导致内存股暴跌，响应出市集对时期“一窍欠亨”，就像丰田推出混动发动机却让石油公司暴跌相似。

摩根士丹利则指出，TurboQuant时期的影响范围是有限的。它仅作用于推理阶段KV缓存，不影响模子权重，也不波及磨真金不怕火门径。因此，这并不虞味着全体存储需求下降到原来的1/6，而是提高单元硬件杀青，让疏导的硬件能处理更长的高下文或职业更多用户。

此外，摩根士丹利征引“杰文斯悖论”（Jevons Paradox），该表面以为，杀青提高时时不会减少资源浮滥，反而会因资本下降而刺激需求增长。就像瓦特改动蒸汽机提高了煤炭烧毁杀青，杀青却是巨匠煤炭需求量的飙升相似。摩根士丹利以为，通过大幅镌汰单次查询的职业资本，TurboQuant八成让底本只可在云表繁盛集群上运行的模子迁徙至土产货，有用镌汰AI范围化部署的门槛，这可能反而能进一步提振全体需求。

Cloudflare首席履行官Matthew Prince将TurboQuant称为谷歌的“DeepSeek时刻”。近似情况曾在DeepSeek发布时出现：市集一度担忧算力需求下降，但最终AI应用爆发，反而推高硬件需求。一驱动着落的英伟达自后再创历史新高。

从行业限定“内存帕金森定律”来看，TurboQuant省俭的内存不会闲置，而会被赶快浮滥：每一轮硬件升级或软件优化开释出来的存储余量，很快就会被更长的高下文窗口、更大的批处理范围、更复杂的推理需求所兼并。换言之，省俭下来的空间将被用于职业更多并发央求、处理更长的文档，或者运行底本因内存不及而无法加载的大模子，以致可能推进更宽阔的AI应用在手机等出动开发上成为现实。

免责声明：本文内容与数据仅供参考，不组成投资提出，使用前请核实。据此操作，风险自担。

逐日经济新闻ued中国体育

开云官方app下载

上一篇：ued中国官网告白语引民愤罗技中国深夜致歉

下一篇：ued中国体育沉着掀桌子了! 座椅加热透风推拿，续航1500km，从10万多降到8万