編輯 | 劉寶丹
自四年前盤古大模型首次亮相以來,AI 大模型行業風云變幻,不少 AI 大模型廠商加入開源大軍。一直堅持閉源大模型的華為,如今也終于決定打開盤古的大門了。
6 月 30 日,華為正式宣布開源盤古 70 億參數的稠密模型、盤古 Pro MoE 720 億參數的混合專家模型和基于昇騰的模型推理技術。
這是華為首次開源盤古大模型。
華為方面表示,此舉是華為踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行百業的應用與價值創造。
據悉,盤古 Pro MoE 72B 模型權重、基礎推理代碼,基于昇騰的超大規模 MoE 模型推理代碼,已正式上線開源平臺;盤古 7B 相關模型權重與推理代碼將于近期上線開源平臺。
華為首次開源大模型選擇了兩款可應用廣泛的模型。
70 億參數的稠密模型采用雙系統框架,參數量適中、性能均衡、部署門檻較低,具備 " 快思考 " 和 " 慢思考 " 能力,可根據任務復雜度自動切換推理模式。
同時,該模型專為在昇騰 NPU 上優化部署,兼顧推理速度與推理深度,在 AIME、GPQA 等復雜推理基準測試中,超越 Qwen3-8B、GLM4-9B 等同量級模型,適用于智能客服、知識庫等場景。
盤古 Pro MoE 720 億參數的混合專家模型通過在專家選擇階段引入分組機制,確保了跨設備的計算負載均衡,不僅解決了傳統 MoE 架構中專家負載不均衡的問題,還顯著提升了模型的訓練效率和推理性能,更適合處理相對復雜的任務。
AI 大模型浪潮掀起以來," 大模型開源 or 閉源 " 一直是業界的熱門議題。大模型開源的本質是以開放換生態,以生態養技術,相對于閉源而言,可以借助全球開發者的力量加速大模型的研發迭代速度。
開源與閉源也可以理解為是 " 短期盈利 " 與 " 長期生態 " 的權衡:閉源像 " 專利藥 ",靠技術壁壘快速賺錢,但可能被后來者顛覆;開源像 " 通用藥 ",靠規模效應和生態黏性構建護城河,但需要長期投入。
今年春節期間 DeepSeek 的橫空出世,徹底顛覆了整個 AI 行業,也成功彰顯了開源的價值。
在 DeepSeek 的推動下,AI 應用爆發,海內外公司紛紛在自家產品中接入 DeepSeek,直接沖擊了 OpenAI 等 AI 大模型廠商在人工智能領域的市場地位。
基于此,像 OpenAI、百度這樣的堅定的閉源路線支持者,不得不在 " 技術護城河 " 與 " 商業價值 " 之間做出選擇,也決定擁抱開源。
2 月 14 日,百度宣布,文心大模型 4.5 系列即將面世,且 6 月 30 日起全面開源。不約而同地,Open AI 首席執行官山姆 · 奧特曼也在 2 月 13 日稱,未來將重新制定開源戰略。
百度創始人李彥宏在 2 月 11 日的 World Governments Summit 2025 峰會上表示:" 開源能讓你更吸睛。" 他解釋,AI、生成 AI 現在還處在創新萌芽期,快速傳播能加速普及,吸引更多人試水,形成良性循環。
山姆 · 奧特曼則表態稱,OpenAI 在開源 AI 軟件方面 " 一直站在歷史的錯誤一邊 "。他還透露,雖然并非所有員工都同意其觀點,但 OpenAI 內部正討論公開 AI 模型的權重等事宜。
有 AI 業內人士指出,未來," 開源生態 + 閉源核心 " 的混合模式可能成為主流 —— 既通過開源吸引開發者共建生態,又通過閉源技術保持商業競爭力,實現短期盈利與長期布局的平衡。
在此背景下,華為部分開源盤古大模型也是大勢所趨。
此外,華為此次還開源了基于昇騰的模型推理技術,昇騰這一層級對應的則是華為瞄準的 AI 算力市場。
眾所周知,華為的野心在于要做 AI 時代的 " 黑土地 ",其昇騰生態戰略是華為圍繞昇騰 AI 計算平臺構建的全方位生態發展策略,旨在推動 AI 技術普及應用、促進產業創新、實現各方共贏,涵蓋技術創新、生態構建、開源開放、人才培養等多個關鍵層面。
開源盤古大模型,有利于吸引開發者基于盤古大模型開發行業應用,形成 " 模型 - 應用 - 硬件 " 的昇騰生態閉環。
在 6 月 20 日召開的華為開發者大會 2025 上,華為常務董事、華為云計算 CEO 張平安在發布盤古大模型 5.5 的同時,還正式宣布基于 CloudMatrix 384 超節點的新一代昇騰 AI 云服務全面上線,為大模型應用提供澎湃算力。
據悉,華為云新一代昇騰 AI 云服務基于 CloudMatrix 384 超節點,首創將 384 顆昇騰 NPU 和 192 顆鯤鵬 CPU 通過全新高速網絡 MatrixLink 全對等互聯,形成一臺超級 "AI 服務器 ",單卡推理吞吐量躍升到 2300 Tokens/s,與非超節點相比提升近 4 倍。
值得一提的是,超節點架構能更好地支持混合多專家 MoE 大模型的推理,可以實現 " 一卡一專家 ",一個超節點可以支持 384 個專家并行推理,極大提升效率;同時,超節點還可以支持 " 一卡一算子任務 ",靈活分配資源,提升任務并行處理,減少等待,將算力有效使用率(MFU)提升 50% 以上。
盤古大模型基于昇騰云的全棧軟硬件訓練,因此,華為開源盤古大模型的本質,也是在為昇騰生態引流。
2025 年已是開源模型快速進步的一年,華為如今加入開源大軍,無疑將讓其在全球 AI 競爭中占據戰略主動。