Artificial Analysis 是一家做 AI 能力測評的權威機構。
幫助工程師和企業精準把握 AI 的能力,從而做出戰略決策。它的方法是:用大量數據說話,做系統性分析。
2025 年 6 月中期,它們發布了一份:《2025 年第二季度中國 AI 亮點報告》。
這份報告盤點中國 AI 在全球的位置,順便對比一下,中美在語言模型這塊到底誰強一點。
一
先看一些具體數據和案例。自從 2022 年 ChatGPT 發布后,中美 AI 之間的差距一度顯得很大,但到了 2025 年 5 月,這個差距已經縮小到不足三個月了。
這意味著,中國的 AI 實驗室和企業在這些年里取得了巨大的進步。
DeepSeek R1(2025 年 5 月)在 Artificial Analysis Intelligence Index 中評分 68 分;阿里巴巴的 Qwen3 235B A22B 評分 47 分。
相比之下:OpenAI 的 o3 也是 68 分;Gemini 2.5 Pro 則是 67 分,你看,中美兩國在這方面的差距已經非常小了。
中國是如何實現這一跨越的呢?簡單來說:技術性能提升和戰略上的突破。
拿 DeepSeek 的 R1 模型來說,通過強化學習(RL)優化,在推理能力上有了顯著提升;這款模型在 2025 年 5 月發布時,已經是全球最智能的開源模型之一。
它不僅有 671B 的參數規模,其中活躍參數為 37B,還在多個評測標準中表現出色,比如 MMLU-Pro、GPQA Diamond 等。
再看看戰略上的突破。
中國頭部實驗室普遍采用了開放權重策略,即公開旗艦模型的權重,加速技術共享和擴散。這種做法和美國頭部公司的閉源策略形成了鮮明對比。
舉個例子:
阿里巴巴發布的 QwQ 32B Preview 在 2024 年 11 月首次超越了 Meta 的 Llama 3.1 405B,成為當時最智能的開源模型。這種開放的態度不僅促進了技術的進步,也吸引了全球開發者的關注和參與;不僅如此,中國企業還在不斷探索新的應用場景和技術路徑。
所以,中美前沿語言模型差距的縮小,首先靠技術創新;但除了技術上的突破,真正讓中國 AI 走得更遠、更快的,其實是一張 " 戰略底牌 ":開放權重。
什么是開放權重?
有些公司把最厲害的模型藏得嚴嚴實實,生怕別人知道;另一些公司,反其道而行之,不僅公開模型,還把它的 " 大腦 " 都亮出來給大家看。
聽起來是不是有點不可思議?畢竟模型是花了大價錢、大量時間才訓練出來的,直接公開出去,不怕被別人拿去用了嗎?
但中國很多 AI 實驗室和企業,偏偏選了這條路。為什么?因為他們發現了一件事:閉門造車,不如開門迎客。
二
這種 " 開放 " 的做法,有三點好處。一,它大大降低了技術門檻。
你想做 AI 開發?沒問題。直接下載一個已經訓練好的模型,在它的基礎上做優化、調整、甚至二次創新;就像搭積木一樣,別人已經搭好了地基,你只需要往上加磚就行。
第二,能加速技術擴散。
一個模型一旦開源,全球的開發者都能參與進來,提建議、改代碼、開發新應用,這樣一來,模型本身的迭代速度就會變得非常快。
最關鍵的一點是:它構建了一個生態。誰用得好,誰就能在這個平臺上創造價值。反過來又能推動模型本身的發展。
中國 AI 圈對 " 開放權重 " 這件事,可謂玩明白了。
字節跳動的 Seedream 3.0(2024 年 12 月),作為圖像生成領域的開源模型,不僅在國內被廣泛采用,還吸引了大量海外開發者參與二次開發。
騰訊的 Hunyuan 2.0(2025 年 4 月),在自然語言處理領域,其權重完全公開后,成為國內企業定制化服務的首選模型。
除此之外,像阿里巴巴、華為這些頭部機構,過去一年里也都陸續推出了自己的旗艦開源模型,而且是連權重一起公開的那種。
這些動作不是偶然,而是中國 AI 界的一種共識:開放不是放棄控制,而是贏得影響力的方式。
然而這一切,和美國比,差距到底在哪呢?
目前,像 OpenAI、Anthropic、Google 這樣的公司,依然堅持一種叫做 " 閉源 " 的策略。他們雖然會發布一些 API 接口或者模型推理能力,但核心的模型權重是不對外公開的。
這背后當然有商業上的考量,比如保護知識產權、維持競爭優勢、防止模型被濫用等等。
但從另一個角度看,也意味著他們的模型只能由內部團隊或授權用戶優化,外部開發者很難真正參與進去。
這就像是一場 " 技術民主化 " 的實驗;誰掌握的開發者越多,誰未來的影響力就越強。
這樣做有沒有風險?當然有。
首先是商業模式問題。如果模型完全開源,靠什么賺錢?過去 " 賣模型 "、" 收許可費 " 的方式顯然就不適用了。
所以,現在國內也在探索新的模式,比如提供高級技術支持、定制化服務、商業化插件等,來彌補開源帶來的收入缺口。
其二,是安全風險。模型一旦開放出去,就很難控制它的使用邊界。有人拿它來做虛假內容生成、惡意攻擊,甚至是自動化詐騙,那就麻煩了。
不過話說回來,這些問題不是中國獨有的,是整個行業都要面對的新挑戰,關鍵在于如何建立合理的監管機制和倫理規范。
所以你看,中國 " 開放權重 ",更像一種戰略思維;它通過降低門檻、加速擴散、構建生態,讓 AI 技術變成了更多人可以參與、可以受益的基礎設施。
而這,也正是中國 AI 能夠在短短幾年內實現快速追趕,并在某些領域實現反超的重要原因之一。
三
靠技術創新、開放權重能快速追趕美國,但問題來了:技術怎么變成產品?誰在推動這些模型真正落地、被大家用起來?
答案藏在中國 AI 的 " 企業生態 " 里。
這是一群公司在各自擅長的位置上發力,形成了一個協同作戰的生態體系;有點像一支球隊,有人負責組織進攻,有人負責防守反擊,還有人隨時準備替補上場。中國的 AI 產業就是這么來的。
先說第一類角色:大科技公司,比如阿里巴巴、騰訊、華為、百度。
它們在生態中扮演什么角色呢?簡單講,搭平臺、給算力、做底層模型,你可以把它們看作是 AI 時代的 " 基建隊 "。
這些大公司打造一個開放、共享、可擴展的技術平臺,讓更多人能參與進來。
再來看第二類角色:AI 初創企業。這類公司數量越來越多,它們有一個共同點:不求全面,但求極致。
Moonshot AI 專注于長文本處理,它的 Kimi 模型支持超長上下文,適合做文檔分析、法律輔助等任務;MiniMax 主打輕量級模型,追求在手機、邊緣設備上的高效運行,更適合中小企業使用。
這些初創企業的存在,讓整個 AI 生態更加多元。它們不像大公司那樣什么都做,而在一個方向上深挖到底,反而更容易做出特色和競爭力。
第三類角色最容易忽視,但也最接地氣:跨界玩家。
什么叫跨界?原本不是做 AI 出身的公司,現在也開始把 AI 當成核心能力來用。
小米以前主要做手機和智能家居,現在它也推出了自己的 AI 模型 MiMo-7B;百度作為搜索起家的公司,也在不斷迭代它的文心一言;360 更直接推出了 " 智腦 " 產品矩陣。
這類公司優勢在于:有用戶基礎、有應用場景、有落地經驗。它們不需要從頭開始造輪子,而把 AI 當作一種 " 增強劑 ",加到已有的產品和服務里,就能產生實際價值。
所以你看,這三類角色各有分工:
大公司提供底層模型和平臺支持;初創企業專注模型創新和技術突破;跨界玩家負責快速落地和商業變現。
如此一來,變成一個多方共建、人人可用的技術平臺。
中國 AI 發展,靠這樣一個多層次、多角色、協同運作的企業生態;正是生態,讓中國在面對像美國這樣擁有強大技術基礎的對手時,依然能夠走出一條屬于自己的路。
四
這條路最終會通向哪里?中美之間 AI 競爭,走向合作,還是徹底走向對抗?
AI 要真正走進我們的生活,不只是能聊天、寫文章那么簡單;它還得看得懂圖片、聽得懂語音,甚至能生成視頻。這才是我們想要的 " 智能體驗 "。
換句話說,未來 AI 必須是 " 多模態 " 的,它得能理解文字、圖像、聲音、動作等多種信息,并且能在這些模式之間自由切換。
所以,要看中國多模態能力,能不能跟美國掰手腕?
語言模型,這方面中美較量,從歷史數據來看,差距已經非常小了,可以說在同一水平線上。
圖像生成領域是老外玩得比較早的方向,Midjourney 和 Stable Diffusion 這兩個名字,在設計師圈子里幾乎是無人不知。
不過這幾年,中國模型也慢慢追了上來。
字節跳動推出的 Seedream 3.0,在 2024 年底發布后迅速走紅。它的圖像質量、細節還原度,已經可以媲美 Midjourney V6。ELO 值達到了 1111,離 V6 的 1150 只差一點點。
阿里巴巴的 Seedream 系列也在不斷迭代更新。
這意味著什么?中國在這個領域和美國站在了同一條起跑線上,誰做得更好,就看誰能更快地滿足用戶需求、落地到實際產品中。
最難的一塊:視頻生成。
如果說圖像生成是 " 比拼細節 ",那視頻生成就是 " 綜合能力大考 "。
為什么說它最難?因為它不僅要處理每一幀的畫面內容,還要保證幀與幀之間的連貫性、動作的流暢性,甚至要考慮音畫同步、鏡頭運動等因素。
目前,這個領域的領先者是 Google。他們推出的 Veo 3 模型,ELO 值高達 1247,可以說是當前最強的視頻生成模型之一。
但它也不是無敵的。
中國快手推出的 Kling 2.0,阿里也發布了 Wan 2.1 版本;它們的 ELO 值分別達到了 1053 和 1039,雖然還比不上 Veo 3,但已經具備了不錯的視頻生成能力,尤其在短視頻、廣告創意等場景中表現突出。
更重要的是,這些模型都基于中國本土應用需求開發的,對中文提示、本地化場景的支持更強。
看到這兒,你可能會問:那中國是不是在全面發力多模態呢?沒錯,而且是集中力量打組合拳。
大科技公司已經開始把語言、圖像、視頻能力整合進同一個平臺。
這種做法的好處很明顯:不再讓每個模態孤軍作戰,而是讓它們協同起來,形成完整的 AI 能力體系。
因此,中國 AI 發展已經是系統性布局。這場競賽還沒有結束。從目前的表現來看,中國已經正在成為全球 AI 多模態創新的重要參與者。
五
走得再快,方向對嗎?中美之間這場關于未來的 AI 競爭,影響力早已超越技術本身,牽動著政策、產業、安全、倫理等多個層面。
事實上,在很多方面,雙方都有合作基礎和必要性。
AI 是高度依賴開放與協作的技術領域,如果完全切斷交流,不僅會影響創新速度,還可能導致資源浪費、重復造輪子。
具體來說,哪些方面可以合作呢?有三點。
一,基礎研究需要共享與互通。雖然現在有些限制,但在基礎模型、算法優化、評估方法等方向上,仍然有很多全球協作的空間。
比如,像 Transformer 架構、擴散模型這些關鍵技術,最初都是由多個國家的研究者共同推動的。這種開放精神如果還能延續,就能為 AI 發展提供更多可能性。
二,行業標準需要共建。
模型評估標準、倫理規范、安全機制……這些都要全球共識;目前已經有多個國際組織在推動 AI 治理框架建設,包括聯合國教科文組織、IEEE、OECD 等。中美作為兩大 AI 強國,其實都參與其中。
雖然節奏不同、立場有別,但至少說明一點:大家都意識到,AI 需要規則,而規則需要共同制定。
三,商業利益驅動合作。政府層面有時會限制出口和技術轉讓,但企業之間的合作動力一直存在。
比如,一些中國企業希望使用英偉達的芯片做訓練,而美國企業也希望進入中國市場。這種相互依賴的關系,客觀上也為合作提供了空間。
當然,我們也必須正視現實:中美 AI 競爭中確實存在明顯的對抗趨勢。
美國已經明確將 AI 列為 " 戰略技術 ",并對中國實施出口管制,比如禁止向中國出售高端 GPU 芯片。
中國也在加大自主研發力度,比如推出華為昇騰、寒武紀、壁仞等國產算力平臺,試圖減少對外依賴。這種 " 脫鉤 " 趨勢一旦加深,就可能演變成兩個平行的技術體系。
不只是技術本身,AI 的應用場景也開始被政治化。美國擔心中國用 AI 進行 " 信息操控 ";中國則認為西方在打壓中國企業的全球擴張。
兩國對 AI 的理解和治理理念也完全不同:美國強調自由創新、市場主導;中國更注重可控發展、社會影響。這種差異導致兩國在 AI 治理理念上很難統一。
比如:數據隱私保護方式不同、對 AI 風險的認知不同、政策執行機制也不一樣。長此以往,可能會形成兩套不同的 "AI 文明 "。
那最終會走向哪里?既不會徹底合作,也不會全面對抗;更有可能出現一種 " 有限合作 + 局部脫鉤 " 的狀態。
類似于,在一些基礎研究、學術交流、行業標準等領域保持合作、在核心技術和國家安全相關領域加強管控、在商業市場中,既有競爭也有互補。
換句話說,中美 AI 關系,將會是 " 斗而不破 " 的狀態。這像下圍棋,每一手都要權衡利弊。既要守住自己的陣地,又要給對手留下一點空間。
AI 未來,不取決于哪一方更強,而取決于能不能找到一個 " 共存 " 的平衡點。
參考:
[ 1 ] 《2025 年第二季度中國 AI 亮點報告》Artificial Analysis,2025 年 6 月,https://artificialanalysis.ai/downloads/china-report/2025/Artificial-Analysis-State-of-AI-China-Q2-2025-Highlights.pdf
本文來自微信公眾號:王智遠,作者:王智遠