亚洲电影在线免费观看,精品国产乱码久久久久久一区二区,国产亚洲精品美女久久久

本文來自微信公眾號：字母榜，作者：馬舒葉，題圖來自：AI 生成

當 7 月 16 日身著唐裝的黃仁勛在公開演講中，將 MiniMax 與 "DeepSeek、阿里巴巴、百度 " 一同提及，并稱 " 開發的產品都是世界級 " 時，沉寂半年之久的 AI 四小強，頗似甄嬛回宮，手里拿上了逆襲劇本。

實際上，進入 7 月，扎堆推出 Deep Research 的 AI 四小強，正躍躍欲試重新登上牌桌。

近期，階躍星辰的階躍 AI Deep Research 正式開啟邀請測試，此前 6 月，MiniMax 連續 5 天上新了推理模型 M1、視頻生成模型、Agent 等，其中 MiniMax-M1 集成了包括 Deep Research（深度研究）在內的技能，同在 6 月，月之暗面的 Kimi Research 跟上。而早在 3 月底，智譜發布了 AutoGLM 沉思版，作為智能體 ( AI Agent ) 也融合了 Deep Research 能力。

截止發稿前，AI 四小強已全搶上這一波 Deep Research 的船票，并在 7 月爭先恐后在模型層上新，前半年低調發育的 AI 四小強，在大廠夾擊下正迅速追上。

" 現在大模型進入了深水區，單靠模型參數或者 Demo 已經沒辦法說服市場了，" 某頭部創投機構聯創林晟（化名）告訴字母榜，對商業化壓力越來越大的 AI 四小強而言，在垂直領域做深，做更能交付價值的 Deep Research 以及 Agent，都是在大廠圍剿中較為安全的生態位。

AI 四小強也 " 需要通過跟上 Deep Research 這樣關鍵的技術迭代向投資人證明，他能在大模型下半場占有一席之地。" 林晟補充道。

同時，對 AI 四小強來說，跟進 Deep Research，押注可以自主規劃任務并交付結果的 AI Agent，不僅是為重上牌桌，也是要搏一個 " 錢景 "。

據外媒報道，為了使用 OpenAI 面向 ChatGPT Pro 用戶推出的 Agent "Deep Resaerch"，約 20% 的用戶升級成了每月訂閱費高達 200 美元的 Pro 會員。同時，恒業資本管理合伙人江一告訴字母榜，隨著 DeepSeek 的爆火，他們慧辰股份推出的消費 Agent，原本在 AI 方面沒有投入預算的客戶，已經將原本信息化的預算挪向 AI，而這些應用 Agent 的訂單往往都在數百萬級別。

這一次，AI 四小強能重新上桌嗎？

一

在 2025 年的 AI Agent 熱潮里，Deep Resaerch（深度研究）類的產品是最早落地的一批。

從去年底谷歌發布首個 Deep Resaerch 開始，數月內，OpenAI、Anthropic 等迅速跟進，能做 PPT、寫財報分析、進行學術研究的 Deep Resaerch 成了新的技術標桿，也讓 AI Agent 在用 AI 輔助人的道路上向前邁了一步。

如今 AI 四小強都推出了自家的 Deep Research，正面硬剛字節、騰訊等大廠。

不過需要注意的是，Agent 作為四小強關鍵的技術展示窗口，楊植麟們的表現頗為謹慎。都以內測版開路，通過一個月的小范圍內測，去收集專業用戶的反饋意見，在調試后才全量上線。

這種謹慎開大的做法也顯露出 AI 四小強對這次亮相的重視。

此外，在 Deep Resaerch 的路徑選擇上，AI 四小強也分裂出了兩種路徑。

一條路徑崇尚傻瓜式操作，門檻更低，以月之暗面的 Kimi-Researcher 為代表，摸著 OpenAI、Gemini 過河。正如 OpenAI demo 所演示的一般，用戶只需發出指令，合上電腦等待，就能得到一份達到研究分析師水準的報告。和月之暗面選擇同樣路徑的，還有字節。

這種路徑選擇讓 AI 自主思考和理解，推理和調用工具來解決問題，極大降低了用戶的使用門檻。" 用戶不需要準備復雜的提示詞，只需要等待，甚至為了沒有耐心的大部分用戶，OpenAI 官方宣稱任務交付時長在 1～30 分鐘，測試下來 Kimi-Researcher 一般都會在 10～20 內生成結果。" 在某國企 AI 相關部門就職的宋城（化名）告訴字母榜。

另一種則是高用戶互動型，結果很可控，包括智譜、Minimax，選擇了類 Manus 的工作流（Workflow）模式。

此外，Kimi 還會提供一份可視化的報告，提供卡片、表格、思維導圖等多種信息，目前 ChatGPT 尚未提供類似的功能。

在這種模式下，用戶需要準備復雜的提示詞，提示詞的復雜程度決定了生成效果，而且在 Agent 工作過程中，隨著持續調用工具，用戶需要加入提供反饋，宋城表示，這種模式 AI 的動作軌跡都一早設計好，可控性更高，只是用戶被綁在了任務上，" 如果一個任務需要跑 1～2 個小時，為了及時給 AI 做確認、糾偏，需要時刻注意頁面。"

但最終兩種路線的分歧，實際上都指向了一個核心問題，即無論走哪一條路，當下大模型的能力還不足以支持更智能的 Agent 的推出。對用戶來說，每次任務執行都有開盲盒的錯覺，因此 AI 四小強也在補足自身的模型能力。

無論是 Mini Max 推出的 M1 新模型，上下文的長度達到一兆，還是月之暗面的 K2 模型，總參數量達到一萬億，就在 7 月 25 日，階躍星辰場發布了 Step 3 大模型。針對國產卡 32K 上下文，這代模型推理效率最高可達到 deepseek R1 的 300%。

二

事實上，從 AI 六小龍到 AI 四小強，楊植麟們的 2025 年過得頗為艱難。

隨著年初 Deepseek 帶起推理模型的新潮流，原本佛系觀戰的騰訊攜元寶強勢下場，阿里也用夸克瀏覽器爭奪新流量入口，字節的豆包短暫從下載榜滑落，但憑借頻繁的迭代上新持續探入垂直場景。

" 在年初我們（Kimi）停止投流之后，國內不少應用商店搜索 kimi 甚至第一頁都看不見，在蘋果 App Store 搜 kimi 會推薦豆包，在某度搜 kimi 會推薦某度 DeepSeek-R1 滿血版。"

Kimi 發布 K2 大模型后，Kimi 的技術員公開表示，即便面對如此艱難的情況，Kimi 也沒有恢復投流。

去年在大模型賽道上激進砸錢推流的 AI 六小龍，一時之間陷入了對自身技術實力的自證漩渦。這似乎也讓楊植麟們意識到，技術實力似乎遠比用戶規模，更能決定大模型創企的發展。

半年內，AI 四小強悄悄調整重心，在生存壓力下，放棄對用戶規模的追逐成了第一步。

從去年 12 月至今，一批負責應用和商業化的六小龍高管相繼離開。其中包括但不限于前智譜 COO 張帆、前 MiniMax 商業化負責人魏偉、前月之暗面核心產品負責人明超平、前階躍星辰 " 冒泡鴨 " 產品負責人張心皓（尚未離職，轉為內部顧問）等等。月之暗面也傳出了調整投放策略的消息。

從 Deepseek 的推理模型，海外科技大廠如 Claude、XAI 等在 Deep Resaerch 上的新突破，到 Manus 的 Agent 熱，大模型的競爭熱詞短短數月換了幾輪。被 DeepSeek 沖擊估值體系的 AI 四小強，不得不重新將技術迭代確立為公司的最高優先級。

而在這場 AI 時代的 " 注意力資源 " 比拼之戰中，重新跟上節奏的 AI 四小強，需要向外界證明自己有重上牌桌的實力和可能性。Agent 成了最好的發力點。

" 過去國內大模型都在對標 OpenAI、復制 OpenAI，現在在 Agent 這樣的應用層，要打差異化了。" 江一告訴字母榜，AI 頭部創企正試圖在垂直技術的長板上去做突破，避免與大廠的同質化競爭。

Kim7 月推出萬億參數的 K2 模型，為智能體任務（agentic tasks）做了專門優化，被 Hugging Face、Perplexity CEO 發文稱贊。多模態則是 MiniMax 的舒適區，近期發布的視頻模型 Hailuo 02 在 Artificial Analysis Video Arena 評測榜上排名第二，僅次于字節的 Seedance 1.0。

可以看到，跑在前面的已經拿到了來自資本市場的好消息。

智譜頻頻傳出融資消息，又成為首個正式開啟上市輔導備案的 AI 大模型創企，MiniMax 爆出即將完成近 3 億美元（約合人民幣 22 億元）新融資，并向港交所提交 IPO 申請，目標 " 今年內上市 "，估值從 25 億美元沖到 40 億～50 億美元之間。

押注 Agent，AI 四小強已經跟上來了。

三

不過，在 Agent 時代，跟上節奏的 AI 四小強還需再次證明自己的價值。

技術卡位戰是楊植麟們首先要自證的第一道坎。盡管月之暗面 6 月發布的 Kimi-Researcher ，聲稱在 " 人類最后一場考試 " ( Humanity's Last Exam ) 中，取得了 26.9% 的 Pass@1 成績，創下最新的 SOTA 水平。但可以看到，相比起引發熱議的 Manus、Lovert，前者拿到硅谷知名風投 Benchmark 領投的 7500 萬美元融資，亮相 3 個月完成文生圖、視頻生成功能的迅速迭代；后者頂著全球首個設計 Agent 的名頭得到了馬斯克的激情點贊。

更為出圈的 Manus、Lovert，調用的都并非國內的大模型。對楊植麟們而言，拿出自研 Agent 只是第一步。他們需要用更出圈的應用案例，證明自身技術的優越性。

"Agent 需要給客戶創造愿意付費并且可量化的價值。"

江一告訴字母榜，在 Agent 創企們拿著錘子找釘子的過程中，出圈的應用案例要給客戶提供真金白銀的可量化價值，而這往往并非用 ChatBot 這類基礎功能可以達到的。他們為一位大客戶交付了 Agent 矩陣，涉及到從門店銷售、找高潛門店售點鋪貨，到定市場策略、協同物流等多個流程。

其中，客戶有 20 萬地推銷售，工資高，流動性更達到 60%～70%，培訓成本占到了營收的 12%。通過培訓銷售使用 Agent，客戶將原本銷售 30 天的入職培訓時間縮短到了兩天，新人用 agent 也能達到中等偏上的銷售水平。

對 AI 四小強來說，找到目標客戶后如何創造遠大于售賣價格的交付價值，用出圈的應用案例證明自己，是必然要闖的第一關。

但在 Agent 大爆發的 2025 年，楊植麟們也缺 " 錢多、有耐心 " 的好客戶。

盡管算力價格被大廠聯手打進 " 厘時代 "，但不同于單純對話的有限的算力消耗，需調用多個大模型、訪問多個網址的 Agent，每個任務的 Token 消耗量都不低。" 生成一份還可用的調研報告，要 22 萬 token，用 cursor（智能編程）一個來回就消耗 300 萬 token"，在某國企就職的宋城告訴字母榜，對企業來說，使用 Agent 的成本并不算低。

同時，技術的迅速迭代也讓 Agent 的使用成本節節攀高。"Manus 發布前核算完成單次任務的成本在 2～3 美元，幾輪優化后原本成本已經降低，但迭代添加視頻生成能力等等，成本又再次拉了上去，" 前 Manus 員工方成（化名）告訴字母榜。

而使用成本的高昂、單次任務執行動輒要半小時、甚至一小時完成任務，就連 OpenAI 也在 " 祈求 " 用戶的耐心。

在 OpenAI 面向 ChatGPT Pro 用戶推出的 Agent "Deep Resaerch" 后，其團隊核心成員 Issa Fulford 接受采訪時就表示 "（OpenAI Deep Resaerch）的目標用戶是專業消費者（prosumer），那些愿意為了一個詳細報告等待 30 分鐘的人。"

根據 SimilarWeb 的監測數據顯示，2025 年以來，Manus 的月訪問量從 3 月的 2376 萬次，跌到了 6 月的 1730 萬次；Genspark 的月訪問量從 4 月的 888 萬次，下降到了 6 月的 769 次。頭部 Agent 的增長頹勢也告訴我們，Agent 距離跑通 PMF（產品市場匹配度）還有一段路要走。

無論如何，可以肯定的是，AI 四小強，必須開始賺錢了。

本文來自微信公眾號：字母榜，作者：馬舒葉

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

AI 四小強重新上桌了？

宙世代

一起剪

相關閱讀

喝罐裝飲料沒清洗 青年疑因此身亡

女孩割完牛草路上收到北大通知書：她走出了大山

中國“媽祖”預警方案發布！守護全球極端天氣防線

大連首家蘋果Apple Store宣布8月關閉：營業近10年

官方披露：山東艦5年起降近萬架次艦載機

特朗普分別與柬埔寨和泰國領導人通電話

工蟻為何放棄繁殖養育同類 科學家揭開螞蟻億年演化之謎

“七下八上”到底有多猛：又到了一年一度的防汛關鍵期

深圳龍崗企業服務“述職”?著力破解企業成長煩惱

有天災不能有人禍！雨還未停，省委書記蹚水察看排澇作業

千萬粉絲網紅道歉！《年輪》原唱之爭，密密麻麻是誰的自尊

年輕人愛上“微醺”，卻沒愛上三得利

暑期孩子喜歡到水域嬉戲：這些知識提前知道能救命

同樣是花宗慶后的錢，對比杜建英和宗馥莉的珠寶，兩人差距好大

成都世運會火炬傳遞圓滿成功

最新評論

讀覽精華

熱門推薦

喝罐裝飲料沒清洗青年疑因此身亡

工蟻為何放棄繁殖養育同類科學家揭開螞蟻億年演化之謎