作為全球首個(gè)集深度研究與實(shí)際操作能力于一體的 Agent,AutoGLM 沉思能夠像人一樣深度研究和反思、像人一樣感知世界、像人一樣使用工具。AI 不僅要卷思考能力,還要卷動(dòng)手能力!
撰文|張賀飛
編輯|沈菲菲
2025 年最熱門的科技話題,大概率是 AI Agent。
僅僅是幾個(gè) KOL 的評(píng)測(cè)文章,Manus 就被捧上了神壇,邀請(qǐng)碼被炒到上萬(wàn)元,淋漓盡致的詮釋了用戶對(duì) AI Agent 的熱忱。
產(chǎn)業(yè)界也出現(xiàn)了 "2025 年是 AI Agent 元年 " 的說(shuō)法,認(rèn)為 AI 將從被動(dòng)響應(yīng)走向主動(dòng)規(guī)劃和執(zhí)行,乃至跨場(chǎng)景的復(fù)雜任務(wù)。
但對(duì)大多數(shù)人來(lái)說(shuō),在聽(tīng)到 "AI Agent" 的名詞后,腦海中浮現(xiàn)出來(lái)問(wèn)題的依然是:到底什么是 AI Agent?
3 月 31 日的智譜 OpenDay 上,智譜發(fā)布了最新的 Agent 產(chǎn)品—— AutoGLM 沉思。作為全球首個(gè)集深度研究與實(shí)際操作能力于一體的 Agent,AutoGLM 沉思能夠像人一樣深度研究和反思、像人一樣感知世界、像人一樣使用工具。
而且發(fā)布即上線,不需要邀請(qǐng)碼即可使用,為無(wú)數(shù)用戶打開(kāi)了體驗(yàn) AI Agent" 神奇能力 " 的大門。
01.
現(xiàn)場(chǎng)接單寫(xiě)稿,
AI Agent 的 " 魔力 " 變現(xiàn)了
按照慣例,先來(lái)看下智譜官方給 AutoGLM 沉思的定義:"AutoGLM 沉思是一個(gè)能探究開(kāi)放式問(wèn)題,并根據(jù)結(jié)果執(zhí)行操作的自主智能體(AI Agent)。它能夠模擬人類的思維過(guò)程,完成從數(shù)據(jù)檢索、分析到生成報(bào)告。"
如果還是似懂非懂,別急,智譜還在發(fā)布會(huì)上進(jìn)行了現(xiàn)場(chǎng)演示。
指令很簡(jiǎn)單:" 幫我在網(wǎng)上賺點(diǎn)錢 "。沒(méi)有指定去什么平臺(tái),也沒(méi)有說(shuō)是什么方式,完全是一個(gè)開(kāi)放問(wèn)題。
然后,奇跡發(fā)生了。
AutoGLM 沉思在網(wǎng)上搜索了相關(guān)信息,譬如問(wèn)卷調(diào)研、有獎(jiǎng)?wù)鞲逡约耙恍┵崅蚪鸬木W(wǎng)站,接下來(lái)思考自己擅長(zhǎng)的能力,最終找到了《讀者》的征稿需求,自動(dòng)撰寫(xiě)了一篇題為《城市角落的溫暖》的稿件,并將稿件以郵件的形式發(fā)送給了征稿指定的郵箱。
每一步都是 AI 通過(guò)連續(xù)、多步推理實(shí)現(xiàn)模型自主規(guī)劃,并通過(guò)反思實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,不需要提前設(shè)計(jì)工作流。
坐在臺(tái)下的我們心情比較復(fù)雜:驚訝的是,AutoGLM 沉思居然可以流暢執(zhí)行這種復(fù)雜的任務(wù),而且是現(xiàn)場(chǎng)演示,壓根沒(méi)有作假的可能;興奮的是,既然 AI 已經(jīng)學(xué)會(huì)自己接單賺錢了,讓我們看到了打造被動(dòng)收入的機(jī)會(huì);忐忑的是,AI 的能力已經(jīng)這么強(qiáng)了,猛然間有種深深的職業(yè)危機(jī)。
Manus 走紅的時(shí)候,外界的情緒也曾被點(diǎn)燃,更多的是因?yàn)榫W(wǎng)站上的 demo 視頻,后續(xù)有不少真實(shí)評(píng)測(cè)出來(lái),效果比預(yù)期中差了很多。智譜的現(xiàn)場(chǎng)演示,直接給出了更有說(shuō)服力的 " 實(shí)戰(zhàn) " 案例。
幫我做一份蘇州兩日游攻略,要求:1、適合父母和孩子游玩,行程不能太累;2、推薦當(dāng)?shù)氐拿朗澈途包c(diǎn),最好去小紅書(shū)上看下評(píng)論。
收到指令后,AutoGLM 沉思先進(jìn)行了深度思考,理解了問(wèn)題里的需求,然后打開(kāi)小紅書(shū)輸入關(guān)鍵詞,逐一閱讀了幾篇熱門內(nèi)容,最后根據(jù)小紅書(shū)上的信息,輸出了一份 3000 多字的兩日游攻略。
內(nèi)容包含酒店推薦、景點(diǎn)介紹、推薦餐廳、交通信息等等,每個(gè)推薦的景點(diǎn)都提供了門票價(jià)格、開(kāi)放時(shí)間、游玩時(shí)長(zhǎng)、周邊特色美食和游覽建議,甚至還給出了親子游的注意事項(xiàng),比如行程安排要適中、哪些要準(zhǔn)備的裝備、景點(diǎn)要提前預(yù)約等,可以說(shuō)既貼心又實(shí)用。
過(guò)程中無(wú)需操作,可以直接智譜清言的瀏覽器窗口最小化,就像是一個(gè) " 活生生的助理 ",也讓我們對(duì) AI Agent 有了更深刻的理解,用一句話來(lái)形容:AI 有了動(dòng)手執(zhí)行的能力,可以一邊想、一邊干。
其中 " 動(dòng)手執(zhí)行 " 能力是 AutoGLM 沉思和 Deep Research 等產(chǎn)品最大的區(qū)別,能夠像人類一樣思考解答步驟,像人類一樣打開(kāi)并瀏覽網(wǎng)頁(yè),完成從數(shù)據(jù)檢索、分析到生成報(bào)告,例如查看小紅書(shū)、公眾號(hào)、京東、知網(wǎng)、巨潮資訊等不對(duì)外開(kāi)放 API 的優(yōu)質(zhì)信源。
需要說(shuō)明的是,本次上線的是 AutoGLM 沉思的 preview 版本,場(chǎng)景集中在 research 相關(guān),智譜將在兩周內(nèi)增加更多的 Agent 執(zhí)行能力,包括推出 " 虛擬機(jī) " 版本,進(jìn)一步增強(qiáng) AI Agent 的實(shí)際落地能力。
02.
發(fā)布即上線,
一場(chǎng)技術(shù)硬實(shí)力的較量
印象深刻的,還有智譜的 " 現(xiàn)貨交付 "。不像 Manus 需要邀請(qǐng)碼才能體驗(yàn),也不像 Open AI 的 Deep Research 需要付費(fèi),AutoGLM 沉思發(fā)布即上線,人人都可以免費(fèi)使用,并且不限制使用次數(shù)。
原因并不難解釋。
首先是技術(shù)的自主性,直接關(guān)系到產(chǎn)品的研發(fā)模式和成本控制。
讓市場(chǎng) " 狂熱 " 的 Manus,被曝出整合了 Deep Research、Artifacts 和 Operator 的能力。爭(zhēng)議點(diǎn)不在于是否有 " 套殼 " 的嫌疑,而是整合不同產(chǎn)品能力帶來(lái)的成本提升," 單任務(wù)成本約 2 美元 "。
AutoGLM 沉思的不同在于:基座模型 GLM-4-Air-0414、推理模型 GLM-Z1-Air、沉思模型 GLM-Z1-Rumination、智能體框架,每一個(gè)環(huán)節(jié)都是智譜自主研發(fā)的,可以根據(jù)需求對(duì)模型進(jìn)行強(qiáng)化訓(xùn)練,成本上也更加可控。
比如推理模型 GLM-Z1-Air,是智譜基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的新一代推理模型,面對(duì)復(fù)雜、開(kāi)放問(wèn)題,能夠進(jìn)行推理和反思,為 Agent 提供了強(qiáng)大的推理、規(guī)劃與反思能力。性能比肩 DeepSeek-R1,在速度提升最高 8 倍的同時(shí),價(jià)格僅需 DeepSeek-R1 的 1/30。
32B 的基座模型 GLM-4-Air-0414,在預(yù)訓(xùn)練階段加入了更多的代碼類、推理類數(shù)據(jù),并在對(duì)齊階段針對(duì)智能體能力進(jìn)行了優(yōu)化,模型在工具調(diào)用、聯(lián)網(wǎng)搜索、代碼等智能體任務(wù)上的能力得到大大加強(qiáng)。
在 GLM-Z1-Air 基礎(chǔ)上通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的沉思模型 GLM-Z1-Rumination,提升了模型結(jié)合工具使用完成長(zhǎng)程推理的能力,打破了傳統(tǒng) AI 單純依賴內(nèi)部知識(shí)推理的局限,創(chuàng)新性地結(jié)合實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證,能夠在復(fù)雜任務(wù)中不斷優(yōu)化推理、反復(fù)驗(yàn)證與修正假設(shè)。
可以說(shuō),智譜技術(shù)自主的實(shí)力,撐起了 AutoGLM 沉思免費(fèi)開(kāi)放的底氣。
其次是創(chuàng)新的連續(xù)性,創(chuàng)新不能被計(jì)劃,也不會(huì)無(wú)緣無(wú)故爆發(fā)。
以往復(fù)盤 Agent 的進(jìn)化歷程時(shí),外界習(xí)慣性以海外產(chǎn)品為標(biāo)桿。
2023 年 7 月問(wèn)世的 Code Interpreter,被視為工具使用的第一步;2024 年 6 月底的 Claude Artifacts,實(shí)現(xiàn)了從生成代碼到圖表的進(jìn)化;2024 年 10 月 22 日的 Computer Use,代表了 AI 能像人類一樣 " 看見(jiàn) " 屏幕并操作計(jì)算機(jī)……
其實(shí)還有另外一個(gè)視角,即智譜的 Agent 布局。
第一階段是工具使用和代碼編寫(xiě),標(biāo)志性動(dòng)作是智譜清言的 Function Call 能力;第二階段是工具流編排,可以追溯到智譜清言在 2024 年初上線的 GLMs;第三個(gè)階段是設(shè)備操控和自主智能體,即 2024 年 11 月的智譜 Agent OpenDay 上推出的 AutoGLM。
剛剛發(fā)布的 AutoGLM 沉思,正是基于智譜自研的推理模型 GLM-Z1-Air 訓(xùn)練的,融入了 AutoGLM 的動(dòng)手操作能力,讓 AI Agent 再次向前邁了一步:不僅能夠思考,還能主動(dòng)行動(dòng),實(shí)現(xiàn) " 邊想邊干 " 的目標(biāo)。
正是 " 一步一個(gè)腳印 " 的連續(xù)創(chuàng)新,才有了比較成熟的 AutoGLM 沉思,給深度思考賦予了動(dòng)手操作的能力,復(fù)雜問(wèn)題也能輕松回答,進(jìn)而帶來(lái)了更好、更快、更便宜的 AI Agent 體驗(yàn)。
技術(shù)世界的真相往往藏在熱鬧喧囂之下,AI Agent 不存在捷徑,終歸還是一場(chǎng)技術(shù)硬實(shí)力的較量。
03.
AI Agent 元年,
從口號(hào)漸漸成為現(xiàn)實(shí)
點(diǎn)燃 AI Agent 革命,可能只需要一個(gè)爆款產(chǎn)品;AI Agent 在產(chǎn)業(yè)端星火燎原,則離不開(kāi)協(xié)同進(jìn)化的生態(tài)體系。
在智譜清言 PC 客戶端上,"AutoGLM 沉思 " 已經(jīng)展示了不少使用用例,包括學(xué)術(shù)、新聞、金融資訊、旅游、穿搭、提醒等等,用一句話來(lái)概括:" 你只需要把任務(wù)交給 AI,它就能自己完成工作,AI 真的能幫人類做事了。"
從只能輸出答案的 Chatbot,到自主決策、使用工具的 Agent,對(duì)用戶價(jià)值的提升是指數(shù)級(jí)的," 動(dòng)手能力 " 將成為 AI 分水嶺。
特別是測(cè)試了 AutoGLM 沉思在更多場(chǎng)景下的表現(xiàn)后,我們更加確信:所謂的 "AI Agent 元年 " 絕非是一句口號(hào),正漸漸成現(xiàn)實(shí)。
之所以給出這樣的判斷,不單單是 AutoGLM 沉思的出色表現(xiàn),還在于一個(gè)和開(kāi)源有關(guān)的計(jì)劃:基座模型 GLM-4-Air-0414、推理模型 GLM-Z1-Air、沉思模型 GLM-Z1-Rumination 等,都將在 4 月 14 日正式開(kāi)源,并且相關(guān)模型會(huì)在兩周內(nèi)陸續(xù)上線 Maas 平臺(tái)(bigmodel.cn)。
DeepSeek 的開(kāi)源,加速了深度推理的產(chǎn)業(yè)落地,智譜自研 Agent 模型矩陣的開(kāi)源開(kāi)放,勢(shì)必會(huì)催生 AI Agent 的應(yīng)用浪潮。
一方面,開(kāi)源打通了千行萬(wàn)業(yè)通向 AI Agent 的路。
以往開(kāi)發(fā)者構(gòu)建一款智能體,需要從不同來(lái)源拼湊各種底層 API,不僅耗時(shí)耗力,任何一個(gè)環(huán)節(jié)出錯(cuò)都可能讓?xiě)?yīng)用崩盤。智譜的全棧開(kāi)源,直接簡(jiǎn)化了 AI Agent 的邏輯、編排和交互,想要打造 AI Agent 的開(kāi)發(fā)者,可以直接調(diào)用智譜的基座模型、推理模型和沉思模型,使用現(xiàn)成的智能體框架低成本打造 Agent 應(yīng)用。
另一方面,AI Agent 的商業(yè)化可行性已經(jīng)被驗(yàn)證。
影響新技術(shù)產(chǎn)業(yè)進(jìn)程的因素,可以歸結(jié)為能力、成本和可控性。就實(shí)際體驗(yàn)效果來(lái)看,智譜的 Agent 能力無(wú)需贅述;相較于國(guó)外動(dòng)輒十幾元的單次任務(wù)成本,智譜給出了超高性價(jià)比的選項(xiàng),甚至可以跑在消費(fèi)級(jí)顯卡上;至于可控性,智譜的全棧自研、全面開(kāi)源以及國(guó)產(chǎn)算力可用,幾乎滿足了 " 自主可控 " 的所用硬性要求。
可以佐證的是,智譜已經(jīng)進(jìn)階為 Agentic 平臺(tái)和生態(tài)級(jí)玩家,一邊持續(xù)探索 " 自主智能體 " 的下一個(gè)階段,一邊幫助生態(tài)伙伴打造基于行業(yè)、地域和場(chǎng)景的智能體應(yīng)用,目前已經(jīng)開(kāi)始攜手金融、教育、醫(yī)療、政務(wù)、企服等領(lǐng)域的合作伙伴,共同推進(jìn) Agentic LLM 的落地應(yīng)用,并相繼與北京、杭州、上海、成都、珠海等城市達(dá)成合作,與當(dāng)?shù)佚堫^企業(yè)攜手推動(dòng)當(dāng)?shù)卮竽P蛻?yīng)用生態(tài)的建設(shè)。
做一個(gè)預(yù)判的話:2025 年或?qū)⑹乔腥f(wàn)業(yè)的 Agentic LLM 時(shí)刻,機(jī)器人、汽車、PC、智能眼鏡、銀行、政務(wù)等都將積極擁抱 AI Agent。
比如方興未艾的人形機(jī)器人賽道,比拼的將不單單是跳舞、后空翻等運(yùn)動(dòng)控制能力,能否在 AI Agent 的賦能下,幫助用戶解決實(shí)際問(wèn)題,產(chǎn)生實(shí)實(shí)在在的生產(chǎn)力,將是人形機(jī)器人行業(yè)的下一個(gè)勝負(fù)手。
04.
寫(xiě)在最后
2025 年以前,AI 行業(yè)卷的是思考能力,賽點(diǎn)是誰(shuí)能打造出更強(qiáng)大的模型、更復(fù)雜的聊天機(jī)器人;2025 年以后,AI 行業(yè)開(kāi)始卷 " 動(dòng)手能力 ",賽點(diǎn)轉(zhuǎn)移到了推理、多模態(tài)、記憶、工具等全棧技術(shù)。
智譜 AutoGLM 沉思的 " 出場(chǎng) ",不單單刷新了 AI Agent 體驗(yàn)的上限,還通過(guò)開(kāi)源抹平了千行萬(wàn)業(yè)走向 AI Agent 的技術(shù)鴻溝,改寫(xiě)了 AI 產(chǎn)業(yè)的技術(shù)路徑,讓我們看到了 AGI 躍遷而生的第一道曙光。
主理人 | 張賀飛(Alter)
前媒體人、公關(guān),現(xiàn)專職科技自媒體
鈦媒體、36kr、創(chuàng)業(yè)邦、福布斯中國(guó)等專欄作者
轉(zhuǎn)載、商務(wù)、開(kāi)白以及讀者交流,請(qǐng)聯(lián)系個(gè)人微信「imhefei」