關于ZAKER 合作
      虎嗅APP 10小時前

      AI 四小強重新上桌了?

      本文來自微信公眾號:字母榜,作者:馬舒葉,題圖來自:AI 生成

      當 7 月 16 日身著唐裝的黃仁勛在公開演講中,將 MiniMax 與 "DeepSeek、阿里巴巴、百度 " 一同提及,并稱 " 開發(fā)的產(chǎn)品都是世界級 " 時,沉寂半年之久的 AI 四小強,頗似甄嬛回宮,手里拿上了逆襲劇本。

      實際上,進入 7 月,扎堆推出 Deep Research 的 AI 四小強,正躍躍欲試重新登上牌桌。

      近期,階躍星辰的階躍 AI Deep Research 正式開啟邀請測試,此前 6 月,MiniMax 連續(xù) 5 天上新了推理模型 M1、視頻生成模型、Agent 等,其中 MiniMax-M1 集成了包括 Deep Research(深度研究)在內(nèi)的技能,同在 6 月,月之暗面的 Kimi Research 跟上。而早在 3 月底,智譜發(fā)布了 AutoGLM 沉思版,作為智能體 ( AI Agent ) 也融合了 Deep Research 能力。

      截止發(fā)稿前,AI 四小強已全搶上這一波 Deep Research 的船票,并在 7 月爭先恐后在模型層上新,前半年低調(diào)發(fā)育的 AI 四小強,在大廠夾擊下正迅速追上。

      " 現(xiàn)在大模型進入了深水區(qū),單靠模型參數(shù)或者 Demo 已經(jīng)沒辦法說服市場了," 某頭部創(chuàng)投機構(gòu)聯(lián)創(chuàng)林晟(化名)告訴字母榜,對商業(yè)化壓力越來越大的 AI 四小強而言,在垂直領域做深,做更能交付價值的 Deep Research 以及 Agent,都是在大廠圍剿中較為安全的生態(tài)位。

      AI 四小強也 " 需要通過跟上 Deep Research 這樣關鍵的技術(shù)迭代向投資人證明,他能在大模型下半場占有一席之地。" 林晟補充道。

      同時,對 AI 四小強來說,跟進 Deep Research,押注可以自主規(guī)劃任務并交付結(jié)果的 AI Agent,不僅是為重上牌桌,也是要搏一個 " 錢景 "。

      據(jù)外媒報道,為了使用 OpenAI 面向 ChatGPT Pro 用戶推出的 Agent "Deep Resaerch",約 20% 的用戶升級成了每月訂閱費高達 200 美元的 Pro 會員。同時,恒業(yè)資本管理合伙人江一告訴字母榜,隨著 DeepSeek 的爆火,他們慧辰股份推出的消費 Agent,原本在 AI 方面沒有投入預算的客戶,已經(jīng)將原本信息化的預算挪向 AI,而這些應用 Agent 的訂單往往都在數(shù)百萬級別。

      這一次,AI 四小強能重新上桌嗎?

      在 2025 年的 AI Agent 熱潮里,Deep Resaerch(深度研究)類的產(chǎn)品是最早落地的一批。

      從去年底谷歌發(fā)布首個 Deep Resaerch 開始,數(shù)月內(nèi),OpenAI、Anthropic 等迅速跟進,能做 PPT、寫財報分析、進行學術(shù)研究的 Deep Resaerch 成了新的技術(shù)標桿,也讓 AI Agent 在用 AI 輔助人的道路上向前邁了一步。

      如今 AI 四小強都推出了自家的 Deep Research,正面硬剛字節(jié)、騰訊等大廠。

      不過需要注意的是,Agent 作為四小強關鍵的技術(shù)展示窗口,楊植麟們的表現(xiàn)頗為謹慎。都以內(nèi)測版開路,通過一個月的小范圍內(nèi)測,去收集專業(yè)用戶的反饋意見,在調(diào)試后才全量上線。

      這種謹慎開大的做法也顯露出 AI 四小強對這次亮相的重視。

      此外,在 Deep Resaerch 的路徑選擇上,AI 四小強也分裂出了兩種路徑。

      一條路徑崇尚傻瓜式操作,門檻更低,以月之暗面的 Kimi-Researcher 為代表,摸著 OpenAI、Gemini 過河。正如 OpenAI demo 所演示的一般,用戶只需發(fā)出指令,合上電腦等待,就能得到一份達到研究分析師水準的報告。和月之暗面選擇同樣路徑的,還有字節(jié)。

      這種路徑選擇讓 AI 自主思考和理解,推理和調(diào)用工具來解決問題,極大降低了用戶的使用門檻。" 用戶不需要準備復雜的提示詞,只需要等待,甚至為了沒有耐心的大部分用戶,OpenAI 官方宣稱任務交付時長在 1~30 分鐘,測試下來 Kimi-Researcher 一般都會在 10~20 內(nèi)生成結(jié)果。" 在某國企 AI 相關部門就職的宋城(化名)告訴字母榜。

      另一種則是高用戶互動型,結(jié)果很可控,包括智譜、Minimax,選擇了類 Manus 的工作流(Workflow)模式。

      此外,Kimi 還會提供一份可視化的報告,提供卡片、表格、思維導圖等多種信息,目前 ChatGPT 尚未提供類似的功能。

      在這種模式下,用戶需要準備復雜的提示詞,提示詞的復雜程度決定了生成效果,而且在 Agent 工作過程中,隨著持續(xù)調(diào)用工具,用戶需要加入提供反饋,宋城表示,這種模式 AI 的動作軌跡都一早設計好,可控性更高,只是用戶被綁在了任務上," 如果一個任務需要跑 1~2 個小時,為了及時給 AI 做確認、糾偏,需要時刻注意頁面。"

      但最終兩種路線的分歧,實際上都指向了一個核心問題,即無論走哪一條路,當下大模型的能力還不足以支持更智能的 Agent 的推出。對用戶來說,每次任務執(zhí)行都有開盲盒的錯覺,因此 AI 四小強也在補足自身的模型能力。

      無論是 Mini Max 推出的 M1 新模型,上下文的長度達到一兆,還是月之暗面的 K2 模型,總參數(shù)量達到一萬億,就在 7 月 25 日,階躍星辰場發(fā)布了 Step 3 大模型。針對國產(chǎn)卡 32K 上下文,這代模型推理效率最高可達到 deepseek R1 的 300%。

      事實上,從 AI 六小龍到 AI 四小強,楊植麟們的 2025 年過得頗為艱難。

      隨著年初 Deepseek 帶起推理模型的新潮流,原本佛系觀戰(zhàn)的騰訊攜元寶強勢下場,阿里也用夸克瀏覽器爭奪新流量入口,字節(jié)的豆包短暫從下載榜滑落,但憑借頻繁的迭代上新持續(xù)探入垂直場景。

      " 在年初我們(Kimi)停止投流之后, 國內(nèi)不少應用商店搜索 kimi 甚至第一頁都看不見, 在蘋果 App Store 搜 kimi 會推薦豆包, 在某度搜 kimi 會推薦某度 DeepSeek-R1 滿血版。"

      Kimi 發(fā)布 K2 大模型后,Kimi 的技術(shù)員公開表示,即便面對如此艱難的情況,Kimi 也沒有恢復投流。

      去年在大模型賽道上激進砸錢推流的 AI 六小龍,一時之間陷入了對自身技術(shù)實力的自證漩渦。這似乎也讓楊植麟們意識到,技術(shù)實力似乎遠比用戶規(guī)模,更能決定大模型創(chuàng)企的發(fā)展。

      半年內(nèi),AI 四小強悄悄調(diào)整重心,在生存壓力下,放棄對用戶規(guī)模的追逐成了第一步。

      從去年 12 月至今,一批負責應用和商業(yè)化的六小龍高管相繼離開。其中包括但不限于前智譜 COO 張帆、前 MiniMax 商業(yè)化負責人魏偉、前月之暗面核心產(chǎn)品負責人明超平、前階躍星辰 " 冒泡鴨 " 產(chǎn)品負責人張心皓(尚未離職,轉(zhuǎn)為內(nèi)部顧問)等等。月之暗面也傳出了調(diào)整投放策略的消息。

      從 Deepseek 的推理模型,海外科技大廠如 Claude、XAI 等在 Deep Resaerch 上的新突破,到 Manus 的 Agent 熱,大模型的競爭熱詞短短數(shù)月?lián)Q了幾輪。被 DeepSeek 沖擊估值體系的 AI 四小強,不得不重新將技術(shù)迭代確立為公司的最高優(yōu)先級。

      而在這場 AI 時代的 " 注意力資源 " 比拼之戰(zhàn)中,重新跟上節(jié)奏的 AI 四小強,需要向外界證明自己有重上牌桌的實力和可能性。Agent 成了最好的發(fā)力點。

      " 過去國內(nèi)大模型都在對標 OpenAI、復制 OpenAI,現(xiàn)在在 Agent 這樣的應用層,要打差異化了。" 江一告訴字母榜,AI 頭部創(chuàng)企正試圖在垂直技術(shù)的長板上去做突破,避免與大廠的同質(zhì)化競爭。

      Kim7 月推出萬億參數(shù)的 K2 模型,為智能體任務(agentic tasks)做了專門優(yōu)化,被 Hugging Face、Perplexity CEO 發(fā)文稱贊。多模態(tài)則是 MiniMax 的舒適區(qū),近期發(fā)布的視頻模型 Hailuo 02 在 Artificial Analysis Video Arena 評測榜上排名第二,僅次于字節(jié)的 Seedance 1.0。

      可以看到,跑在前面的已經(jīng)拿到了來自資本市場的好消息。

      智譜頻頻傳出融資消息,又成為首個正式開啟上市輔導備案的 AI 大模型創(chuàng)企,MiniMax 爆出即將完成近 3 億美元(約合人民幣 22 億元)新融資,并向港交所提交 IPO 申請,目標 " 今年內(nèi)上市 ",估值從 25 億美元沖到 40 億~50 億美元之間。

      押注 Agent,AI 四小強已經(jīng)跟上來了。

      不過,在 Agent 時代,跟上節(jié)奏的 AI 四小強還需再次證明自己的價值。

      技術(shù)卡位戰(zhàn)是楊植麟們首先要自證的第一道坎。盡管月之暗面 6 月發(fā)布的 Kimi-Researcher ,聲稱在 " 人類最后一場考試 " ( Humanity's Last Exam ) 中,取得了 26.9% 的 Pass@1 成績,創(chuàng)下最新的 SOTA 水平。但可以看到,相比起引發(fā)熱議的 Manus、Lovert,前者拿到硅谷知名風投 Benchmark 領投的 7500 萬美元融資,亮相 3 個月完成文生圖、視頻生成功能的迅速迭代;后者頂著全球首個設計 Agent 的名頭得到了馬斯克的激情點贊。

      更為出圈的 Manus、Lovert,調(diào)用的都并非國內(nèi)的大模型。對楊植麟們而言,拿出自研 Agent 只是第一步。他們需要用更出圈的應用案例,證明自身技術(shù)的優(yōu)越性。

      "Agent 需要給客戶創(chuàng)造愿意付費并且可量化的價值。"

      江一告訴字母榜,在 Agent 創(chuàng)企們拿著錘子找釘子的過程中,出圈的應用案例要給客戶提供真金白銀的可量化價值,而這往往并非用 ChatBot 這類基礎功能可以達到的。他們?yōu)橐晃淮罂蛻艚桓读?Agent 矩陣,涉及到從門店銷售、找高潛門店售點鋪貨,到定市場策略、協(xié)同物流等多個流程。

      其中,客戶有 20 萬地推銷售,工資高,流動性更達到 60%~70%,培訓成本占到了營收的 12%。通過培訓銷售使用 Agent,客戶將原本銷售 30 天的入職培訓時間縮短到了兩天,新人用 agent 也能達到中等偏上的銷售水平。

      對 AI 四小強來說,找到目標客戶后如何創(chuàng)造遠大于售賣價格的交付價值,用出圈的應用案例證明自己,是必然要闖的第一關。

      但在 Agent 大爆發(fā)的 2025 年,楊植麟們也缺 " 錢多、有耐心 " 的好客戶。

      盡管算力價格被大廠聯(lián)手打進 " 厘時代 ",但不同于單純對話的有限的算力消耗,需調(diào)用多個大模型、訪問多個網(wǎng)址的 Agent,每個任務的 Token 消耗量都不低。" 生成一份還可用的調(diào)研報告,要 22 萬 token,用 cursor(智能編程)一個來回就消耗 300 萬 token",在某國企就職的宋城告訴字母榜,對企業(yè)來說,使用 Agent 的成本并不算低。

      同時,技術(shù)的迅速迭代也讓 Agent 的使用成本節(jié)節(jié)攀高。"Manus 發(fā)布前核算完成單次任務的成本在 2~3 美元,幾輪優(yōu)化后原本成本已經(jīng)降低,但迭代添加視頻生成能力等等,成本又再次拉了上去," 前 Manus 員工方成(化名)告訴字母榜。

      而使用成本的高昂、單次任務執(zhí)行動輒要半小時、甚至一小時完成任務,就連 OpenAI 也在 " 祈求 " 用戶的耐心。

      在 OpenAI 面向 ChatGPT Pro 用戶推出的 Agent "Deep Resaerch" 后,其團隊核心成員 Issa Fulford 接受采訪時就表示 "(OpenAI Deep Resaerch)的目標用戶是專業(yè)消費者(prosumer),那些愿意為了一個詳細報告等待 30 分鐘的人。"

      根據(jù) SimilarWeb 的監(jiān)測數(shù)據(jù)顯示,2025 年以來,Manus 的月訪問量從 3 月的 2376 萬次,跌到了 6 月的 1730 萬次;Genspark 的月訪問量從 4 月的 888 萬次,下降到了 6 月的 769 次。頭部 Agent 的增長頹勢也告訴我們,Agent 距離跑通 PMF(產(chǎn)品市場匹配度)還有一段路要走。

      無論如何,可以肯定的是,AI 四小強,必須開始賺錢了。

      本文來自微信公眾號:字母榜,作者:馬舒葉

      相關標簽
      ai

      相關閱讀

      最新評論

      沒有更多評論了
      主站蜘蛛池模板: 国产乱码精品一区二区三| 日韩精品无码一区二区中文字幕| 无码人妻一区二区三区在线| 无码一区二区三区中文字幕| 亚洲国产精品乱码一区二区| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 国产免费一区二区视频| 亚洲av无一区二区三区| 亚洲美女一区二区三区| 搡老熟女老女人一区二区| 久久精品一区二区东京热| 成人区人妻精品一区二区不卡网站| 中文字幕一区二区三区四区| 日本精品一区二区三区视频| 一区二区手机视频| 成人国产精品一区二区网站| 精品一区二区三区在线视频观看| 一区二区不卡久久精品| 精品乱码一区内射人妻无码| 日本一区二区三区精品视频| 精品国产一区二区三区AV性色 | 国产婷婷一区二区三区| 日本一区视频在线播放| 国产高清一区二区三区四区| 精品一区二区三区电影| 精品久久久久久中文字幕一区 | 亚洲国产激情在线一区| 美日韩一区二区三区| 正在播放国产一区| 日韩一区二区久久久久久| 美女视频在线一区二区三区| 亚洲福利一区二区| 欧亚精品一区三区免费| 一区视频免费观看| 亚洲国产精品无码久久一区二区 | 爆乳熟妇一区二区三区霸乳| 亚洲一区二区三区电影| 中文激情在线一区二区| 一区二区三区在线播放| 99无码人妻一区二区三区免费 | 无码乱人伦一区二区亚洲一|