唬爛吧
  • 搜尋
      Loading
  • 聯絡我們
  • 唬爛吧粉絲團
  • 首頁
  • 新聞專區
    • 時事新聞
    • 社會新聞
    • 全球新聞
    • 台灣之光
    • 婉君說
  • 短片
    • Kuso短片
    • 汽機短片
    • 搞笑短片
    • 電影預告
    • 其他短片
  • 寵愛女人
    • 彩妝保養
    • 新嫁娘
    • 新手媽媽
  • 動物星球
    • 汪星人
    • 喵星人
    • 其他星人
  • 24H書店
    • 小說
    • 動漫
    • 插畫
  • 生活
    • 美食
    • 旅遊
    • Life 一下
    • 健康瘦身
    • 科技
    • 恐怖/奇趣
  • 體育
    • 旅外國手
    • 運動資訊
    • 球星動態
    • 體壇盛事
  • 娛樂
    • 明星八卦
    • 娛樂盛事
    • 街頭藝人
    • 宣傳動態
  • 性感寫真
    • Sexy Lady
    • 火辣專區
  • 測驗區
    • 心理測驗
    • 小遊戲測驗
  • 首頁/
  • 全球新聞/
  • 危機還是轉機? 谷歌新記憶體技術「這原因」陷爭議
  • 1

危機還是轉機? 谷歌新記憶體技術「這原因」陷爭議

危機還是轉機? 谷歌新記憶體技術「這原因」陷爭議

分享
梅姬|檢舉

TurboQuant解決了傳統壓縮技術產生的「記憶體雜訊」。(圖/新華社)

記者:林孜軒



記憶體缺貨有轉機,搜尋引擎巨頭Google近日釋出AI記憶體壓縮技術 「TurboQuant」,宣稱能在不犧牲模型精準度下,將生成式AI推理階段最消耗資源的「鍵值快取(KV Cache)」空間需求大砍6倍,並讓運算速度暴增8倍。


TurboQuant的核心優勢,在於解決了傳統壓縮技術產生的「記憶體雜訊(Overhead)」。一般當用戶與AI對話時,模型需要將每一輪的對話內容暫存於記憶體中,隨著對話增加,內容會迅速擠爆GPU的高頻寬記憶體(HBM),成為AI推論速度與成本的最大瓶頸。


Google這套不僅優化了Gemini等大型模型的檢索效率,根據實測,在輝達(NVIDIA)H100 加速器上,TurboQuant 相比未壓縮方案,效能最高提升了8倍,更無須重新訓練模型即可直接掛載。


儘管AI技術進步令人振奮,但資本市場卻認為「硬體需求恐將萎縮」,引發記憶體族群股價一度重挫。富國銀行分析師Andrew Rocha認為:「TurboQuant 正在直接攻擊記憶體成本曲線,一旦被廣泛採用,資料中心對記憶體容量的規格要求將被打上大問號。」


市場認為,TurboQuant對手機、筆電等終端裝置更具意義。由於行動裝置記憶體有限,這類高效壓縮技術能讓更強大的AI模型在手機本地端運行(Ondevice AI),這反而會刺激各類終端裝置進行記憶體規格換代。







原文網址:https://www.ctwant.com/article/475187/


Tweet

返回頂部

最新文章

他花1元買筷子「統一發票竟中4000元」 網羨慕:投報率太狂了

香港最難吃伴手禮是它? 「吃不完禮盒」成討論焦點

41萬條KitKat巧克力遭劫車離奇消失 官方證實:造成供應短缺

3月怎麼還沒過完? 一票人崩潰喊時間變慢

油價漲不停!他問「可拿空桶囤汽油嗎」 內行給建議

危機還是轉機? 谷歌新記憶體技術「這原因」陷爭議

30歲女狂吃「EVE止痛藥」慘洗腎 醫揭1成分傷腎

57歲男掃墓脫口「明年不來了」竟變遺言 離開途中昏倒送醫搶救不治

《浪姐7》參賽名單曝!范瑋琪、蕭薔參戰 直播無修音超殘酷

AI短劇《雪山救狐狸》爆紅50億次 主創坦言為推醬板鴨創作

©2014 丫博士. All Rights Reserved. 聯絡我們 | 廠商合作