| 代碼 | 名稱 | 當前價 | 漲跌幅 | 最高價 | 最低價 | 成交量(萬) |
|---|
在AI浪潮中,模型參數增長和算力堆疊一度成為競逐焦點。不過站在當下時點 ,當生成式AI開啟規模化落地,戰場已經轉向推理:真實場景中海量數據的瞬間調用 、百萬Token的連續推理、長上下文的高效處理,在提升了算力需求的同時,也重新定義了算力基建的價值鏈 。
在日前的AI基礎設施峰會上 ,英偉達發布了全新Rubin CPX GPU。據官方介紹,這顆芯片專為長上下文推理負載設計,是英偉達首顆專為需要一次性處理大量知識(數百萬級別Tokens)并進行AI推理的模型構建的芯片。
英偉達稱 ,這顆芯片可以為客戶帶來“前所未有的投資回報率”——每部署價值1億美元的新芯片,將帶來50億美元收入,投資回報率約50倍 ,遠超GB200 NVL72的約10倍回報率。此外,公司宣布GB300 NVL72機架級系統在最新MLPerf推理基準測試中創造了新推理基準記錄 。
花旗研究指出,在ASIC競爭加劇的環境下 ,英偉達曾經一年一度的產品發布腳步開始提速,Rubin CPX在產品路線圖中“插隊 ”,標志著“推理時代”已經到來。
分析師進一步指出 ,Rubin CPX的發布和MLPerf新紀錄都展現了英偉達在AI基建領域的持續創新能力。隨著AI推理需求、特別是長語境推理需求爆發,英偉達的新品組合有望帶動收入顯著增長 。
值得注意的是。本周引發全球市場矚目的甲骨文,也提到了推理市場需求的爆發。
在業績會上,公司創始人Larry Ellison明確指出 ,AI正從根本上改變甲骨文,AI推理市場將“遠大于”AI訓練市場,而市場上的推理算力正在被耗盡 。
雖說甲骨文指數級別的訂單爆炸性增長 ,以及隨之而來對OpenAI依賴性的質疑,讓其股價在飆升之后連跌兩天。但摩根大通也表示,承認甲骨文在獲取OCI業務方面取得了“令人印象深刻的成就” ,并認可其在AI領域的長期潛力。
▌算力基礎設施進入長上下文推理新階段
實際上拉長時間線就能發現,海內外大廠Token調用量已出現明顯加速拐點,推理端算力需求快速增長 。
今年5月Google I/O大會的數據顯示 ,Google的Token月均調用量從去年4月的9.7萬億增長至今年4月的480萬億,增長50倍。根據微軟三季度電話會數據,Azure AI基礎設施在今年一季度處理了超100萬億Token ,較去年同期增長5倍,其中3月份單月Token調用量達50萬億。國內互聯網大廠來看,今年5月字節火山引擎Token日均調用量為16.4萬億(月均508T),是去年5月的137倍 。
過去一年 ,隨著生成式AI進入規模化落地階段,行業對“長上下文 ”的需求快速上升。無論是企業級知識庫問答、代碼生成,還是多模態長視頻生成 ,均需要模型在極大輸入序列下保持推理準確性與計算效率。然而,現有GPU在應對超長上下文時普遍存在內存帶寬瓶頸與計算冗余,導致算力利用率不足。
東吳證券指出 ,從產業角度來看,Rubin CPX的推出不僅是英偉達產品線的升級,更意味著海外算力基礎設施進入“上下文與生成分工協作”的新階段 。隨著百萬Token推理與長視頻生成成為AI應用的標配需求 ,硬件和軟件的耦合度顯著提高,算力產業鏈的價值量同步上升。無論是GPU 、存儲、網絡,還是配套的高速PCB、光模塊與封裝工藝 ,相關廠商都有望深度受益。
股票配資平臺網站:配資平臺大全-新一輪保險預定利率調降啟幕 合資公司同方全球人壽打響市場第一槍 1.5%預定利率分紅險上新
配資平臺實盤:股票配資股-油閥全開?歐佩克+或批準新一輪大增產 提前終結減供時代
十大正規實盤配資平臺:股票配資公司-十大券商策略:“慢牛”行情趨勢不變 新一輪行情隨時可能啟動
成都股票配資公司:陜西配資平臺-匯嘉時代盤中“地天板”!此前3連漲停!衛星導航概念股異動拉升
北京正規的股票配資公司:十大配資平臺證券-美軍跨洋摧毀“委內瑞拉運毒船”打死11人 合法嗎?
專業配資平臺排名第一:股票線上配資-哈梅內伊強硬發聲:永不妥協!特朗普警告:我知道他身在何處 我們的耐心正在耗盡!
還沒有評論,快來說點什么吧~