文 | 科技新知 AI 新科技組,作者 | 櫻木,編輯 | 江籬
2025 年 5 月,紅杉資本 AI 峰會在舊金山落下帷幕,在這場包含 Open AI 創始人 山姆 · 奧特曼 以及 谷歌首席科學家 Jeff Dean 等 150 位全球頂尖 AI 公司創始人 、科學家以及投資人 的大會中,一個共識逐漸被確立下 來 —— 即 下一輪 AI,賣的不是工具,而是收益。 這句看起來有些跳躍的話, 紅杉 給出了 一個模式 性的解釋,即未來 AI 將 從賣工具到賣協作,最終走向賣成果(Software as an Outcome)。
如何從賣工具到賣結果,這場紅杉的峰會更具落地的意義,也許在于強調了 Agent 的價值。隨后,硅谷大廠開啟了第一波加速, 微軟 CEO 納德拉在主題演講中宣布:" 我們已經進入了 AI Agent 時代,正在見證 AI 系統如何以全新方式幫助我們解決問題。"Open AI CEO 山姆 · 奧特曼宣布,推出面向開發者的新 Codex 智能體,稱 " 這可能是編程史上最大的變革 。"
而除了通用 Agent 之外,各個大廠在垂類 Agent 方面也在不斷加速。阿里飛豬問一問,百度旗下的法行寶等也在不斷擴張。
Agent 作為大模型之后 的 第二波確定性浪潮,已經開啟了加速爭奪,而最后 影響戰局的變量 , 除了各家的生態厚度,還有對于心智、用戶習慣的占領。 這也就意味著最終能夠參戰的,也許只剩下阿里與百度 、 字節、騰訊等少數玩家,而率先出牌的百度與阿里,能否搶得先機,值得一番拆解。
Agent 爆發年,也是沖刺年
第一個叫醒大廠的,顯然是 Manus,這家由真格基金投資的國產 Agent 團隊,在 2025 年 3 月初 突然上線了 Manus , 從開啟內測伊始,就贏得了全世界的關注。"10 萬元搶一內測碼 "、" 一碼難求 " 等熱詞刺激著人們的神經。主流觀點第一次意識到,基于主流大模型的 Agent 居然能夠實現如此強大的實操型功能應用與用戶體驗。而大廠的動作,似乎從那時起,就開啟了加速。
字節是飽和攻擊的代表。在晚點的報道之中,3 月初, 智能體應用 Manus 出圈前后,字節已有至少 5 個團隊在開發不同智能體產品,其中有些是對內工具。 而這一數字在 4 月底時,已經達到了 7 個團隊。4 月底,字節的 flow 團隊拿出 定位為 " 用戶與 AI Agent 協同辦公的最佳場所 " 的扣子空間并開啟內測,扣子 基于自研的豆包大模型(如豆包 1.5Pro)構建,支持 MCP(模型上下文協議)協議,可調用飛書多維表格、高德地圖、圖像工具等組件 。
從大模型的競爭,到 Agent 的競爭,大廠到底在角逐什么?簡而言之,是技術加速后,交互方式的變化,對生態級別的入口爭奪。
一個典型的類比,就是在大模型時代,當 DeepSeek 出現之后,由于其技術的領先性,沒有花費任何營銷費用,就輕松獲取了龐大的用戶量,而騰訊憑借著元寶對 DeepSeek 的鏈接,直接搶奪到了大模型時代的入場券。今天的 Agent 也是一樣的邏輯,技術的底層已經成型,誰家的產品可以快速的成型,就意味著對市場碾壓級別的領先。
在紅杉分享會中,一個特殊的方向也被提到,即 企業級市場中,真正先跑出來的入口未必是通用大模型,而是 Harvey(法律)、Open Evidence(醫療)這類垂直領域智能體 OS,因為它們能聽懂行業語言,理解真實需求。 而對于這兩個 Agent,其中 open evidence 大家較為熟悉,投資人朱嘯虎在多次訪談中提及,作為 專為醫生設計的 AI 診斷輔助工具,通過精準的臨床支持和創新的商業模式,迅速在美國醫生群體中普及。
所以可以看到的是,Agent 的潛力不僅局限在某一兩個應用上,更重要的則是生態級別的入口。而從這個角度來看,大廠無論是做智能體生態,垂直應用 Agent,還是做通用 Agent(心響、扣子,以及夸克)似乎都是必須要爭奪的方向。
勝負手在哪兒?
"Manus 能夠成功,我們可以看到它用的是 cloude3.5 模型。" 秘塔創始人在一檔播客欄目中曾經評價到。從某種程度來說,這也意味著行業內的共識,最明顯的例證來自于字節的扣子團隊。
在晚點的報道中 " 扣子是個開放的平臺,如果國內有大模型效果比豆包好,我們也會積極使用。" 扣子團隊開發扣子空間時,豆包深度思考模型還沒發布,他們曾考慮優先使用 DeepSeek -R1,測試后發現它調用工具的能力不夠。
后來團隊又對比六款國內大模型,使用了豆包 1.5 Pro 為主的多款模型。因為豆包在指令遵循、調用工具,以及多模態處理能力上表現最好,而且推理成本很低,能支撐大規模調用。
而這一觀點,也被行業內廣泛認同,拾象科技李廣密曾在播客中坦言,預訓練可能會重新變得重要,而大模型的能力也決定著 Agent 等能力。
從這個角度來看,百度、阿里與字節幾乎可以說不分伯仲。百度拿下了與蘋果的合作,從某種程度來說,蘋果作為智能手機行業最大的入口,承認了百度在模型能方向上的能力。而阿里則擁有 qwen 這個可能是最優秀的開源大模型。對于字節來說,基于豆包大模型的產品長期霸占著 c 端下載量,實力也非常出眾。而三方大量資源的傾注,讓這場爭奪愈發激烈。
當然,從 Agent 應用的角度來看,生態的厚度也是考量勝負手的關鍵。 Agent 的 本質上其實就是能夠 " 讓 AI 真正實現自主完成任務 " , 而相關能夠調用的應用的能力也是其能否贏得戰役的關鍵。
這一點,幾家大廠的選擇似乎有所區別, 百度 開放了 大模型和千帆開發平臺兼容,地圖、文庫、網盤、 Comate 也 開放了 MCP Server。 但字節則相對保守,更愿意自身成為全新的 Agent 工廠,阿里把所有都集合在夸克之中,超級框的概念,就是另一種能力上的調用。
當然,評價生態的厚度的變量還有很多,但可以看出的是,阿里的領先優勢正在擴大。
從形態上來看, Agent 仍然是一種社交,而從社交的視角來看,騰訊系則無疑占據著強大的優勢。騰訊總裁劉熾平回應道:" 在微信生態系統內,我認為我們有機會創造一個非常獨特的 Agent,即 AI 與微信生態系統特有的內容相連接,包括社交、通信和社區能力以及內容生態系統,比如公眾號和視頻號,以及數以百萬計的小程序。實際上你可以接入各種信息,以及許多不同垂直應用程序的交易和操作能力。"
獨一無二的社交生態,讓騰訊特別是微信 Agent 也成為了不容忽視的力量。
此外,成本也是 Agent 能否完成蛻變的另一重關鍵。3 月 18 日,The Information 報道,Manus 現階段的產品同時受制于其服務器容量和高昂的運營成本。據兩位直接了解情況的人士透露,Manus 使用人工智能公司 Anthropic 的模型,平均每完成一項任務需向 Anthropic 支付 2 美元。
Agent 還未到 "GPT 時刻 "
盡管大廠的競速與 Manus 等爆款產品的出現讓 Agent 賽道熱度飆升,但 可以確認的是,當 前行業 似乎 遠未達到類似 GPT 的顛覆性臨界點。 從技術成熟度、商業模式落地到用戶心智占領,Agent 仍需跨越多重鴻溝。
一方面, 當前 Agent 的核心能力仍高度依賴大模型,但模型本身存在顯著局限性。CSDN 博客指出,在處理多步驟任務時,大模型的規劃能力容易崩潰,例如銀行轉賬這類需十幾步操作的流程,模型常因邏輯鏈斷裂而失敗。
同時, 盡管大廠紛紛推出 Agent 平臺,但生態整合仍處于碎片化狀態 , " 各自為戰 " 的局面導致工具調用接口不統一。不同 Agent 對其功能的調用方式差異顯著,開發者需重復適配。
紅杉峰會提出的 "Software as an Outcome" 理念雖被廣泛認同,但落地路徑仍不清晰。當前 Agent 主要以訂閱制或按調用次數收費,本質上仍是工具思維。例如, Manus 的高成本導致其難以向中小企業普及,而百度心響雖宣稱直接可用,但企業用戶更關注其能否真正提升銷售轉化率或降低運營成本。
此外, 垂直領域的探索雖初現曙光,但規模化仍需時間。阿里飛豬問一問在旅游場景的表現可圈可點,百度法行寶在法律領域也積累了案例,但這些垂類 Agent 的行業滲透率仍 然不高 。用戶對 Agent 的信任度尚未建立,尤其在涉及敏感數據的場景中,企業更傾向于保留人工審核環節。
Agent 的爆發印證了 AI 從技術到應用的躍遷,但距離真正的 " GPT 時刻 " 仍有漫長道路。
當前的競爭本質上是生態卡位與場景定義權的爭奪 ,大廠的角逐 布局 似乎都 在為未來的生態戰爭鋪路。而決定最終勝負的,不僅是技術迭代速度,更是對行業痛點的理解深度與商業模式的創新勇氣。當 Agent 能像水電煤一樣融入日常生活,真正的變革才會到來。
參考資料:
晚點 latepost《字節 AI 再創業:獨立組織、全鏈條的飽和攻擊》
新皮層 newthings《 掌權一年半來,吳泳銘是如何管理阿里巴巴的 》
騰訊科技 《 微軟一晚上發了 50 個新東西,要建一個 Agent 互聯的 " 伊甸園 " 》
AI 深度研究員《 只談生存:AI Agent 倒計時 730 天,硅谷 3 位 " 異見者 " 給出 3 條活路 》
AI 深度研究員《 紅杉 AI 峰會閉門 6 小時,150 位創始人共識浮現:AI 不再賣工具,而是賣收益 》
中國企業家《 AI 新戰場,騰訊押注 Agent 》