關于ZAKER 合作
      鈦媒體 1小時前

      GPU 王座動搖?ASIC 改寫規則

      文 | 半導體產業縱橫

      在 ASIC 市場,近日聽到的一些言論是相悖的。

      " 全球眾多 ASIC 項目中,90% 會失敗 " 這句話來自英偉達 CEO 黃仁勛。

      黃仁勛對于 ASIC 的評價并不算多。因此相關言論一出,市場上關于 ASIC 成長性的討論瞬間多了起來,各種猜測層出不窮。

      黃仁勛表示,相較于英偉達主打通用 GPU 架構,ASIC 專為特定任務打造,雖在單一用途上效能與效率極高,但缺乏靈活性與擴展性。這種 " 單點優化 " 策略,難以應對 AI 應用快速演進的現實。黃仁勛評價 ASIC 時并非否認其價值,而是強調 " 入場門檻與運維難度都很高 "。他以谷歌 TPU 為例稱,其團隊是 " 全球最強 ASIC 團隊 ",但即便如此,谷歌 Gemini 模型仍同時部署在英偉達 GPU 上。

      但市場上另一種聲音同樣有依據——在 ASIC 的迅猛發展中,英偉達已嗅到危險的信號。

      01 ASIC,趕超 GPU?

      在算力芯片市場,ASIC 的 " 簇擁者 " 可并不算少。在 ASIC 芯片大廠、云巨頭等助推下,AI 算力市場正在迎來新的臨界點。

      根據野村證券的最新報告,目前英偉達 GPU 占 AI 服務器市場 80% 以上,ASIC 僅占 8%-11%。

      然而,從出貨量的角度來看,情況正在發生變化。到 2025 年,谷歌的 TPU 出貨量預計將達到 150-200 萬臺,亞馬遜 AWS Trainium 2 ASIC 約為 140-150 萬臺,而英偉達的 AI GPU 供應量將超過 500-600 萬臺。

      供應鏈調查顯示,Google 和 AWS 的 AI TPU/ASIC 的總出貨量已經達到 Nvidia AI GPU 出貨量的 40%-60%。

      隨著 Meta 于 2026 年開始大規模部署其自主開發的 ASIC 解決方案,Microsoft 將于 2027 年開始大規模部署,預計 ASIC 總出貨量將在 2026 年的某個時候超過英偉達 GPU 出貨量。

      這也意味著,屬于 ASIC 的時代將正式到來。

      OpenAI 宣布測試谷歌 TPU 的消息也進一步點燃市場熱情。據悉,人工智能(AI)技術大廠 OpenAI 已開始租用谷歌的 AI 芯片,以支持旗下 ChatGPT 和其他產品的計算需求。對此 OpenAI 回應稱,目前沒有使用谷歌自研芯片來驅動產品的計劃。

      不過,OpenAI 發言人指出,雖然公司的 AI 實驗室確實正在初步測試部分谷歌的 TPU,但目前尚無計劃大規模采用。

      目前,OpenAI 主要依賴英偉達的 GPU 以及 AMD 的 AI 芯片來滿足其日益成長的 AI 計算需求。為了降低對于英偉達、AMD 的依賴,OpenAI 也正在開發自家芯片,計劃今年達成 "tape-out" 里程碑,即芯片設計完成并送交制造。

      上一位采用谷歌 TPU 而引起轟動的是蘋果。去年 7 月,蘋果在官網的一篇論文中披露,其訓練模型采用了谷歌研發的第四代 AI ASIC 芯片 TPUv4 和更新一代的芯片 TPUv5。

      在去年之前,與英偉達 GPU 相比,谷歌的 TPU 還像是一位 " 名不見經傳 " 的小將,如今看來,似乎已有實力與英偉達 GPU 展開一番較量。

      但是在筆者看來,"ASIC 芯片是否在未來有望碾壓 GPU?" 這更像一個偽命題。

      02 ASIC,核心優勢

      市場普遍認為,ASIC 芯片正成為 AI 芯片的重要分支。但是 ASIC 究竟以何種優勢給 GPU 帶來沖擊?以及具體帶來哪些沖擊,相關討論卻較少。

      針對一系列問題,筆者將對此展開討論。

      根據承擔任務的不同,AI 芯片主要可以分為兩類,它們分別是 AI 訓練芯片和 AI 推理芯片。

      2025 年,全球 AI 推理算力需求呈現爆發式增長,特別是在端側應用場景中。這對于 ASIC 來說,也是一個契機。

      首先說一下什么是推理。

      推理是 " 用已訓練好的模型處理數據 " 的過程(比如用訓練好的圖像識別模型識別照片、用語音模型轉寫語音)。一旦模型部署,其算法邏輯(如 CNN 的卷積層、Transformer 的注意力機制)、計算流程(輸入輸出格式、精度需求)會長期固定,幾乎不需要調整。

      這種 " 固定性 " 正好匹配 ASIC 的核心優勢 ——為單一任務定制硬件架構:可以直接將推理算法的計算邏輯、數據路徑 " 固化 " 到芯片中,去掉所有無關的通用計算單元(如 GPU 中用于訓練的動態調度模塊、通用內存控制器),讓硬件資源 100% 服務于推理計算。

      同理,ASIC 在訓練任務中的能力就相對弱一點。因為訓練任務算法迭代快,需求靈活。ASIC 若用于訓練,算法更新時,芯片面臨失效風險,性價比要低得多。

      推理場景對" 能效比 "(每瓦功耗能提供的算力)和 " 成本 " 的敏感度遠高于訓練,而 ASIC 在這兩方面具有碾壓性優勢。

      能效比方面,谷歌 TPU v5e TPU 的能效比是英偉達 H100 的 3 倍。

      成本方面,AWS 的 Trainium 2 在推理任務中性價比比 H100 高 30%-40%,谷歌的 TPUv5、亞馬遜的 Trainium2 單位算力成本僅為英偉達 H100 的 70% 和 60%。

      一個大模型可能只需要幾十到幾百張訓練芯片(如 GPU),但推理階段可能需要數萬甚至數十萬張芯片(比如 ChatGPT 的推理集群規模是訓練集群的 10 倍以上)。因此 ASIC 的 " 定制化 " 設計可以降低單芯片成本。

      VerifiedMarketResearch 數據顯示,2023 年 AI 推理芯片市場規模為 158 億美元,預計到 2030 年將達到 906 億美元,在 2024-2030 年預測期內的復合年增長率為 22.6%。

      當前的推理場景正呈現 ASIC 與 GPU 共存競爭的格局,ASIC 芯片市場空間巨大。

      近日,博通 CEO Hock Tan 與 CFO Kirsten Spears 也在會議中強調,該公司 AI 推理領域的訂單顯著增加,該公司目前正與四個潛在的 AI XPU 客戶緊密合作,計劃在今年為摩根大通認為的 Arm/ 軟銀和 OpenAI 等主要客戶完成第一代 AI XPU 產品的流片。

      再看訓練市場的競爭態勢。AI 訓練芯片市場,幾乎沒有幾家競爭者,英偉達一家就占據了 AI 訓練市場 90% 以上份額,其 Blackwell 架構支持 1.8 萬億參數模型訓練,且 NVLink 6 技術實現 72 卡集群無縫互聯。

      上文提到,訓練任務的 " 靈活性 " 與 GPU 架構天然契合,此外,英偉達通過 CUDA 平臺構建了難以撼動的軟件生態:90% 以上的 AI 框架(TensorFlow、PyTorch)原生支持 CUDA,開發者無需重寫代碼即可調用 GPU 算力。這種生態慣性使得即使 AMD、華為等廠商推出性能接近的訓練芯片,用戶遷移成本依然極高。

      有業內人士向半導體產業縱橫表示,模型架構的穩定性是 ASIC 發揮價值的核心前提——模型穩定時,ASIC 的低成本、高效能優勢能充分釋放;模型快速迭代甚至出現革命性變革時,ASIC 容易因適配滯后而失效。

      這也是為什么業內一些專家將 ASIC 市場規模爆發的節點指向 2026 年。ASIC 的設計周期長達 1-2 年,而 AI 模型迭代速度極快(如大模型從 GPT-3 到 GPT-4 僅用 1 年)。若 ASIC 設計時錨定的模型過時(如 Transformer 替代 CNN),芯片可能直接失效。

      而如今隨著大模型的發展,算法初步固化。再加上 ASIC 成本的持續下探,它也便有了更好展示自己的舞臺。

      至于 ASIC 是否會替代 GPU?在筆者看來這個問題為時尚早。

      短時間內看,ASIC 和 GPU 的競爭,本質是 " 效率 " 與 " 靈活性 " 的權衡,二者暫時并非互相替代關系。ASIC 在特定場景的優勢,無法打破 GPU 的生態壁壘;而 GPU 的通用性,讓它在復雜任務中難以被替代。未來,兩者會借助混合架構(如 GPU + ASIC 加速卡)和異構計算(如 CUDA 與定制指令集協同),實現資源最優配置。

      未來隨著 AI 市場的發展,究竟需要何種芯片,尚難定論。

      03 芯片龍頭,紛紛切入 ASIC

      除了谷歌,國內外均有多家 AI 芯片公司選擇擁抱 ASIC。

      Meta

      Meta 的核心算力負載來源于推薦系統場景,具備自研強調專用性的 ASIC 芯片的土壤。

      Meta 于 2023 年和 2024 年分別推出 MTIA V1 和 MTIA V2 芯片。此外,Meta 還計劃 2026 年推出 MTIA V3 芯片,預計將搭載高端 HBM,與 V1/V2 芯片專注于廣告與社交網絡等特定任務不同,有望擴展應用至模型的訓練與推理任務。

      亞馬遜 AWS

      AWS 在 AI 芯片的布局主要包含推理芯片 Inferentia 和訓練芯片 Trainium 兩大系列。

      自 2020 年以來,亞馬遜發布了三代 Trainium 芯片。其中 Trainium3 性能或較上一代提升 2 倍,能效提升 40%,搭載該芯片的 UltraServers 性能預計提升 4 倍。

      微軟

      2023 年 11 月,微軟在 Ignite 技術大會上發布了首款自家研發的 AI 芯片 Azure Maia 100,以及應用于云端軟件服務的芯片 Azure Cobalt。兩款芯片將由臺積電代工,采用 5nm 制程技術。

      Cobalt 是基于 Arm 架構的通用型芯片,具有 128 個核心,Maia 100 是一款專為 Azure 云服務和 AI 工作負載設計的 ASIC 芯片,用于云端訓練和推理的,晶體管數量達到 1050 億個。這兩款芯片將導入微軟 Azure 數據中心,支持 OpenAI、Copilot 等服務。

      下一代 Maia v2 的設計已確定,后端設計及量產交付由 GUC 負責。除深化與 GUC 的合作外,微軟還引入美滿電子共同參與 Maiav2 進階版的設計開發,以強化自研芯片的技術布局,有效分散開發過程中的技術與供應鏈風險。

      在國內 ASIC 芯片方面,華為和寒武紀表現突出。

      華為海思旗下昇騰系列處理器自誕生以來,憑借其強勁的算力和創新的設計,特別是昇騰 910B,在技術和應用上都取得了顯著突破。

      寒武紀作為國內 AI 芯片設計領域的佼佼者,在推理計算及邊緣設備 AI 加速方面市場競爭力日益凸顯。寒武紀的旗艦產品 MLU590 專注于 AI 訓練與推理。

      在全球 AI 芯片競爭中,國產 ASIC 芯片既面臨挑戰,也迎來歷史性機遇。通過持續創新和技術突破,國產 ASIC 正逐步擴大市場份額。

      04 ASIC 芯片,兩大受益者

      在 ASIC 市場,目前博通以 55%~60% 的份額位居第一,Marvell 以 13%~15% 的份額位列第二。

      博通在 AI 芯片領域的核心優勢在于定制化 ASIC 芯片和高速數據交換芯片,其解決方案廣泛應用于數據中心、云計算、HPC(高性能計算)和 5G 基礎設施等領域。博通的 ASIC 芯片業務已成為其核心增長點。財報披露,定制 AI 芯片(ASIC)銷售額預計占第二季度總 AI 半導體收入的 70%,達 308 億美元(約合 450 億美元)。

      目前,博通已與三家超大規模云服務提供商(如谷歌、Meta、字節跳動)合作,并新增 OpenAI、蘋果等客戶,未來計劃擴展至七家大型科技企業。其中博通有兩個大合作備受關注:第一是 Meta 與博通已合作開發了前兩代 AI 訓練加速處理器,目前雙方正加速推進第三代 MTIA 芯片的研發,預計 2024 年下半年至 2025 年將取得重要進展。

      Marvell 的定制 ASIC 業務正成為其強勁增長的核心動力之一。Marvell 的具體業務中,數據中心業務占據 75% 左右,屬于高成長業務。這部分業務包括 SSD 控制器、高端以太網交換機(Innovium)及定制 ASIC 業務(亞馬遜 AWS 等定制化芯片),主要應用于云服務器、邊緣計算等場景。

      根據公司交流及產業鏈信息推測,Marvell 當前的 ASIC 收入主要來自亞馬遜的 Trainium 2 和谷歌的 Axion Arm CPU 處理器,而公司與亞馬遜合作的 Inferential ASIC 項目也將在 2025 年(即 2026 財年)開始量產。公司與微軟合作的 Microsoft Maia 項目,有望在 2026 年(即 2027 財年)。

      覺得文章不錯,微信掃描分享好友

      掃碼分享

      熱門推薦

      查看更多內容
      主站蜘蛛池模板: 日韩精品一区二三区中文| 亚洲av无码一区二区乱子伦as| 人成精品视频三区二区一区| tom影院亚洲国产一区二区| 日韩精品福利视频一区二区三区| 国产一区二区不卡在线播放| 日韩aⅴ人妻无码一区二区| 亚洲av无码不卡一区二区三区| 国产在线一区二区杨幂| 人妻无码一区二区三区免费| 国精产品一区一区三区| 不卡一区二区在线| 男人的天堂精品国产一区| 正在播放国产一区| 国产AV一区二区精品凹凸 | 国产av夜夜欢一区二区三区| 中文字幕精品一区二区| 日本一区频道在线视频| 无码一区二区三区在线观看| 久久se精品一区二区| 精品一区二区三区中文字幕 | 日韩精品久久一区二区三区| 91国偷自产一区二区三区| 亚洲综合无码一区二区痴汉 | 日本成人一区二区三区| 亚洲无线码一区二区三区| 无码人妻一区二区三区在线视频 | 亚洲第一区在线观看| 久久精品国产亚洲一区二区三区 | 国产AV一区二区三区传媒| 日本中文字幕一区二区有码在线| 亚洲日韩激情无码一区 | 久久久久人妻精品一区三寸蜜桃| 一区二区国产在线播放| 日韩十八禁一区二区久久| 男人免费视频一区二区在线观看| 搜日本一区二区三区免费高清视频| 波多野结衣一区二区免费视频| 在线成人综合色一区| 国产激情精品一区二区三区| 国产一区二区三区乱码|