從小就是「學霸」的王小川,其實不太喜歡自己的「學霸」標簽。
他在離開搜狗后的一次交流里,和極客公園創始人&總裁張鵬講過自己的看法:「學霸」的另一面,意味著在別人設定好的命題里取得「高分」,但他接下來其實想找到自己的命題,不想再做別人命題里的學霸了。
但ChatGPT 的爆發,帶著大模型浪潮撲面而來,王小川自己和所有熟悉他的人,都覺得他是最適合AI時代的中國創業者之一。故事似乎和之前一樣,王小川成立百川智能符合所有人的期待,然后就是響亮的AI 六小虎的稱號,以及大家在模型評分榜上的位置,產品MAU的數據、商業化ARR數字,等等。看起來王小川還是繞不開大家對于「學霸」的期待,有一堆必答題要去回答。
王小川自嘲,一度自己覺得百川成了三個公司:一個做模型,一個做toB商業化,一個做AI醫療。而王小川內心真正想做的,并非市場所期待的通用模型問題,而是「為人類造醫生,為生命建模型。」
王小川一度覺得這個命題,在迎合更多業界必答題的過程中,從原點變成了「遠方」,這讓他覺得很有問題。這種撕扯,最終以今年4月開始的大調整而和解。王小川做出了選擇:團隊從450人精簡至不足200人,回歸扁平,回歸專注。人數少了,團隊的「壓強」反而上去了,這讓他對于未來,也更有底氣和信心。
外界猜測這是「遭遇困境」后的被動收縮,唱衰百川的各種報道滿天飛,這可能是王小川創業這么多年來被負面新聞包裹得最緊的一次。但是王小川本人選擇沉默、完全沒有回應。按照他的原話是「我需要的是跟自己的內心做斗爭,而不是跟環境做斗爭」。
直到8月12日,當王小川帶著百川全新的醫療大模型Baichuan-M2亮相后,外界才終于看懂了他沉默的這幾個月在做什么。這款大模型的性能超過了OpenAI新近發布的兩個開源模型;而在閉源領域,它的能力也僅次于GPT-5。但這還不夠。對王小川而言,他的目標,是在醫療這個垂直領域,實現對通用模型的超越。
這個時候,百川感覺上才真正變回了「一家公司」,而王小川也終于結束「一言不發」,愿意坐下來和張鵬再次進行一場長談。
這更像是一次坦誠的復盤,一次對過去兩年喧囂的總結。也是一次對上半年不少朋友「小心翼翼」的關心和擔心的回應。王小川覺得他現在的狀態很好,因為他不再需要回答別人強加的必答題,而是可以真正定義自己的問題,并給出他更銳利的答案。
以下為王小川與張鵬對話內容實錄,有編輯刪減。
張鵬: 最近GPT-5終于發布了,我們曾想象它會再次引領產業的大飛躍,但世界給予的反饋,似乎并不符合這個版本應該有的震撼。現在大家探討AI coding的熱情、以及感嘆Anthropic估值已經接近2000億美金的熱情似乎更高漲,你怎么看這些現象?
王小川: 這可能是美國激烈競爭格局下的必然結果。畢竟那邊牌桌上還有Grok、Anthropic等強勁的對手。值得注意的是,AI coding確實也呈現了一個可能比ChatGPT擁有更好商業模式和數據飛輪的通向AGI的通道。
很可能,今天OpenAI正處于一個相對劣勢的階段,在競爭壓力下顯得有些倉促地發布了產品。所以,給人感覺有點「拉下神壇」了。但我覺得這不代表OpenAI就此沉寂,更不意味美國AI創新后繼無人。恰恰相反,這證明了其他競爭者的實力,他們正在激烈地爭奪王座。
張鵬:我們該如何理解這種現象?OpenAI有做錯了什么嗎?
王小川: 從技術路線圖來看,我從一開始就更欣賞Anthropic的策略,尤其是它將代碼作為發展的中心,這條路是以API為中心,特別是深耕代碼能力。語言模型強化到代碼層面,就能夠賦能千行百業。
而OpenAI選擇是把重心放在一個C端的App上,
最初由Ilya Sutskever提出的「predict next token」(預測下一個詞元)開啟了大模型范式,沿著這條路走下去,代碼本應是可見的、必然的方向。但或許是因為OpenAI的「包袱」過重,什么都想要,反而無法專注,也就難以找到最關鍵的軸心去突破。
當它需要服務7億用戶時,就無法將代碼置于足夠高的戰略位置。我認為這是一種路線圖上的風險。
我心中的AGI(通用人工智能),其核心是代碼能夠自動運行。對此我有兩個邏輯:一個是從產業應用場景出發,例如造醫生;但從更極致的技術追求來看,代碼才是中心。
因此,無論從產品形態還是技術路線圖來看,OpenAI都沒有走在我期望的路徑上。
張鵬: Anthropic的估值已經漲到了1700億美元。我記得你每次都會強調,「語言才是智能的中軸」。所以「代碼語言」這個軸線上的高速發展已經開始了唄?
王小川: 代碼,本質上就是一種更高級的語言。
最近Geoffrey Hinton也開始講,人類智力的核心在于「類比」。這正是我一直信奉的,語言的本質就是類比與推理。我之前反復推薦侯世達的《表象與本質》,那本書用完整的篇幅闡述了這件事。
因此,數學是語言,代碼也是語言,而且是一種「可運行」的語言。它就像圖靈機一樣,能夠解決萬千問題。所以,真正的道路是清晰的:首先,通過人類語言理解常識、學會溝通;然后,掌握數學語言與代碼語言,從而征服理科與工科。 這條路,我過去在很多場合都講過,從未改變。
今天代碼的快速崛起已經開始驗證其價值,更重要的是它的數據飛輪也已經高速啟動了。
其實代碼的終極用法,不是輔助程序員,而是它自己就能運行。今天所有類似的Cursor工具,本質上還是在輔助程序員。而一旦代碼能夠實現自我運行,AGI也就到來了。我還記得多年前在知乎寫過一個帖子,標題是:「程序員是自己的掘墓人」。現在,這句話正在被驗證。
張鵬:以前大家對「智能的高度」特別充滿熱情,每次新模型的屠榜跑分都會被認真討論很久,但感覺今天Coding帶來了一個「應用的深度」和「智能的高度」可以一起前進的事情。未來「應用的深度」是不是會變得更被重視?
王小川: 沒錯。單純的評測已經不夠,已經到了可應用的階段。
其實除了代碼的價值已經肉眼可見,今天大家對醫療的期待,也是與日俱增的。國內大家討論得偏少,但其實醫療正迅速從「非共識」走向「共識」。盡管Anthropic在代碼領域跑得更快,但OpenAI在今年5月發布了Health-Bench,把醫療健康納入核心評測維度。在OpenAI的產品發布會上,「健康」與「醫療」被反復強調。甚至在發布開源模型時,技術報告開篇第一章,就是闡述它在醫療領域的進展。
最值得玩味的,是在GPT-5的發布會上,唯一被請上臺為它背書的,是一位癌癥患者。
OpenAI身負著服務7億用戶的巨大「包袱」,這迫使它必須超越純粹的技術敘事,走向一條「以人為中心」的路線。在這條路上,醫療是其無法回避,且必須占領的戰略高地。
張鵬: 硅谷確實還在越來越熱鬧,但過去一段時間,大家都覺得國內大模型領域許多備受矚目的創業公司,也包括百川智能,似乎都變得「安靜」了。這背后有什么共性原因嗎?
王小川: 身在局內,我反而覺得這是一個極其自然的過程。
2023年是歷史性的一年,資本的恐慌性涌入和對未來的無限暢想,是技術變革的必然序曲。這有點像Gartner技術成熟度曲線的規律,當期望膨脹到頂峰,現實與應用之間的距離必然會導致一個調整期。當人們發現技術突破未能立即轉化為應用爆發,熱情冷卻,行業便會安靜下來重新思考。
回答這個問題,必須從技術與環境兩個層面來看。技術層面,如果大家研究下OpenAI最新的開源模型,會發現它在基礎設施與工程化上的深厚實力,這不僅關乎算法。我們一度以為已經拉近的距離,現在又被重新拉開。我們期待國內同行在底層架構上持續追趕,而百川也會在醫療這樣的垂直領域,做出自己的貢獻。
然而,比技術差距更嚴峻的,是來自大環境的挑戰。美國頭部公司動輒百億美金的融資,以及像Anthropic年化經常性收入(ARR)已接近百億美金的規模,這在國內目前都難以想象。說實話,在這樣的牌局里,任何一家能夠「咬住」不掉隊,本身已是一件了不起的事情。
本質上,我們和美國存在一個「時間差」。當他們已經進入以ARR為核心的「摘果子」收獲期時,我們絕大多數人還身處圍繞基準測試(Benchmark)和參數的「模型內卷」階段。這種階段上的錯位,會直接導致「底氣」的缺失。
張鵬: 這種「看ARR」與「看參數」的差異,根源在于技術,還是商業環境?
王小川:我認為是雙重疊加:既有技術追趕的壓力,也源于商業土壤的不同。
張鵬: 那之前大家在模型上投入的熱情和資源,你覺得值得嗎?如果這是一場如此艱難的追趕?
王小川: 我認為,這取決于一家公司的終極抱負。
如果你的目標是打造一個輕巧、敏捷的公司,那么完全可以不自研模型。比如一個十幾人甚至幾個人的小公司,通過調用最優的第三方模型,完全有可能快速實現正向現金流,并獲得資本的青睞。
但如果你立志要成長為一個長期的、具有系統性影響力的大公司,那么在模型層面的自主積累,就是一件不可或缺的事情。
02 重新變回一家「有自己命題的公司」
張鵬:最近投資圈都在「感謝」大模型公司「釋放了很多優秀人才」,讓他們看到了不少值得投,值得搶的新項目。百川的業務和人員調整好像也挺大的,這背后你是怎么想的?
王小川: 你肯定還記得2023年百川當時的策略就是「快」。快速入場、快速融資、快速搶占技術身位。這讓我們在高峰期一度達到450人。速度為我們贏得了有利位置,但也帶來了「思想無法統一」的后遺癥。
許多人帶著對大模型的熱情,甚至是源于FOMO的恐懼,加入了百川,我們卻未能真正「捏成一股繩」。公司內部甚至自嘲,已經分裂成了做模型、做醫療、做商業化「三個公司」。
后來,我在全員信中也坦誠溝通了這件事:我們必須回歸創業的初心——「為人類造醫生,為生命建模型」。
所以最近在組織上確實做了很多調整,直接說結果就是從450多人變成了不到200人,然后我們把管理層級從平均3.6級壓縮至2.4級,從今年4月到6月,花了兩個多月,我們完成了這次調整。你會發現,人數少了,整個團隊的「壓強」反而上去了,這讓我對未來更有底氣。我感到非常高興的是,最終留下的,是一支既有AI信仰,又對醫療抱有熱忱的團隊。
張鵬:當初的快速擴張,在多大程度上是被客觀的產業節奏裹挾?又在多大程度上,是因為自己主觀上沒控制好節奏?
王小川: 我認為是「三七開」——三分客觀,七分主觀。
客觀上,在當時那個狂熱的時間點,想要完全抵抗住浪潮的推力,確實很難。但更深層的原因,在于我自己。我確實為了迎合媒體、迎合團隊、迎合外界的期待,做了很多「多余的動作」。
比如,我對金融這類能快速變現的方向,內心并無真正的熱情。但當時有團隊想做,有股東感興趣,我就「從」了。現在回看,這本質上是自己當時的「心力」還不夠強大。而攤子鋪得越大,心力被稀釋得就越厲害。
張鵬:現在想想的話,當時有辦法更好的避免這種問題嗎?
王小川:我還真反思過,而且可能解法還真沒那么復雜。比如當時如果我能堅持面試每一位新同事,情況會好很多。因為這個過程中就一定會讓自己「慢下來」、想清楚。創業者一旦只判斷和選擇目標,而不充分參與過程之痛苦,很多判斷就會出問題。
我看其實大家的節奏調整都差不多,我相信行業會回歸理性,大家也終將更專注于自己真正想做的事。
對我而言,這次調整最大的收獲,是未來變得前所未有的清晰。因為我終于明白,真正的斗爭,從來不是與環境的斗爭,而是與自己內心的斗爭。
張鵬 :前段時間因為這些調整負面報道滿天飛的時候,是不是有好多朋友給你打電話慰問?
王小川 :慰問是有的。但大家似乎都有些小心翼翼,大都不敢打電話,反正就是各種謹慎小心的關心我,說的問的都挺含蓄。
張鵬: 你覺得大家為什么要來小心翼翼的「慰問」你?或者說他們為你擔憂的是什么?
王小川:估計是覺得我壓力大。之前,無論對我,還是對百川,外界都抱有某種期待。當百川的發展軌跡,沒有完全符合大家想象中那種高歌猛進的劇本時,可能一種低于預期的感受便產生了。我內心很清楚,媒體曾經給予了多少贊譽,當現實與預期出現偏差時,外界就會感受到同等程度的「失望」。
張鵬: 所有的媒體贊揚,本質上都是一種「預支的借款」。
王小川:特別對。要么是消耗過往積攢的信譽,要么是透支未來的承諾,但終究是要「償還」的。所以,外界的情緒,本質上是與你的發展速度和最終成績緊密掛鉤的。 張鵬:在那段時間里,你本人真實的狀態是怎樣的?
王小川: 說實話,我確實沒有焦慮。我非常感謝大家的關心。很多人曾將自己對技術的理想,部分投射在了我們身上。所以當百川的路徑看似「偏離」時,那種失落感是真實存在的。
而我之所以不焦慮,是因為我看到了大家沒看到的東西。
大家期待的百川,和我內心真正想構建的百川,其實存在一個錯位。早在2021年,甚至在創立百川的公開信里,我就明確提出,我未來二十年的熱情在于生命科學和大眾健康。ChatGPT的出現,只是讓實現這一目標的路徑變得更加清晰和可行。
但在2023年那個時間點,整個市場都沉浸在一種狂熱里。無論是投資人、媒體,還是團隊成員,他們都帶著美國最前沿的模式作為對標,希望你做的跟美國一樣,因為那是被驗證過的、成功率最高的路徑。
在那種氛圍下,你去談醫療,是很難被聽進去的。所以,我們當時在某種程度上「迎合」了市場的期待,沿著大家都能看懂的「共識」路徑在走。
但當我們的探索開始深入,逐漸回歸到醫療的時候,之前那些因大模型、AGI加入的人,都會產生一種跟期待不一致的地方。
而百川在過去一年里完成的最重要的一件事,就是經歷調整,真正回歸到了我們自己對于未來的「意義感」和核心驅動力上。
張鵬:你真實「第一人稱視角」的投身大模型領域的起心動念是什么?我很好奇在過去的幾年間,為什么沒有去調整大家對你們的認知錯位呢?
王小川: 當我決定下場時,是因為我真切地感受到了「模型」的力量。2023年初,我第一次深度使用ChatGPT時,內心有兩種強烈的沖擊。
第一種,震撼。因為我之前專注于醫療領域,對最前沿的技術進展沒有那么緊密地追蹤。一上手,我心里就咯噔一下,意識到:天變了。我過往做輸入法、做搜索,每天都在和語言AI打交道,所以我能清晰地判斷,眼前的這個東西,和過去完全不是一個物種。
第二種,隨之而來的是一種失落感。我曾經也算是AI圈的中心人物,但那一刻,我發現自己想做的醫療事業,似乎與AI的主旋律,變成了兩條平行線。
后來,我很快就想明白一個事:今天的大模型,能不能被用來「造醫生」?
這個想法,讓我內心的兩條邏輯線索瞬間串聯了起來:
第一條邏輯:語言是智力的中軸。掌握了語言,就掌握了構建智能、乃至「造人」的關鍵。第二條邏輯:醫生是醫療的中軸。構建了「AI醫生」,就能掌握用戶、藥廠和科研的樞紐。
所以,技術上,我們在「造人」;應用上,我們則是在「造醫生」。因此,我們從基礎模型做起,因為你不可能依賴一個不開源的外部模型,去構建你的核心壁壘。
我的計劃始終是,超級模型里要走到AGI,超級應用則要去「造醫生」。但問題是,當時你向外界講述這個「超級應用」時,大家聽不進去,他們只能聽懂,或者說更愿意聽「超級模型」的故事。
到了2024年,我們意識到,以百川的資源和國內的整體環境,你不可能同時在兩條戰線上無限拉長。從基礎模型到最終構建一個成熟的「AI醫生」,這條路過于漫長,你不可能把所有事情都自己做完。
這就好比2016年AlphaGo出現時,我看得非常清楚,但這不代表我當時就有能力親自下場把它做出來。基于對能力和資源的判斷,我們決定,必須「聚焦」在醫療上。
張鵬: 但這時候這種「錯位」就開始劇烈的釋放「應力」了?
王小川: 對。在我看來,這是戰略上的「聚焦」;但在行業眼中,這變成了「放棄模型」、「管不住團隊了」……各種各樣的解釋都冒了出來,因為這不符合他們最初為你設定的那個「預期」。
張鵬: 所以你是如何消化這件事的?好奇為什么當時沒有出來說說話而一直保持沉默?是不想說?還是沒的說?
王小川:肯定不是沒的說,我有很多要說的,但說的對象可能不是行業和公眾吧。因為你首先要從內心接受一個前提:大家在不同視角下看到不同的東西,是正常的。
一旦你接受了這一點,就不會再有情緒上的內耗。我不是去說服每一個人,而是清晰地表達,然后找到那些真正聽懂了,或者愿意花時間去聽懂的人,與他們并肩工作,這就足夠了。
我既不會因為外界的不理解而憤怒,也不會因此而動搖。我的價值,恰恰在于我可能比大家多看到了一些未來的可能性。同時,我的責任,是要去溝通和花時間「對齊」那些同樣懷有醫療夢想、并選擇留下來的人,為他們創造一個最好的工作環境。當你內心真正篤定你想要什么時,這本身就是對自我的尊重,是對團隊的尊重。
張鵬:所以這兩年,你最大的收獲是什么?
王小川: 我的第一個,也是最感幸運的一點是:我之前想做醫療的夢想,與大模型的技術突破,真正相遇了。
這就像我過去做互聯網的20年,本質上是擁抱了一個巨大的時代浪潮。沒有時代,個體的努力會緩慢而曲折得多。而AI的到來,讓「造醫生」這件事,突然有了清晰可行的路徑。
我們已然上桌,技術讓夢想有了「解」,身在牌局之中。我覺得是很幸運的一件事情。
第二個巨大的收獲,是我個人心境的成長吧。
早年做搜狗的時候,追求極致,無法容忍任何與我認知不符的東西,常常會因此陷入「為什么會這樣」的執念,對內、對外都產生了很多不必要的攻擊和消耗。
而現在,我可以說,我達到了十年來心境最好的狀態——一種發自內心的平和。
當然,遇到做得不好的地方,我依然會直接指出,但不再是老板對員工的指令,而是一種共創的狀態。我希望大家能真正地從內心走到一起,共同去成就一件事,這本身就是一次巨大的提升。
過去,面對這種局面,我的反應是憤怒——「為什么事情會走向失控?」,進而產生對抗情緒;或者,是逃避——假裝看不見,期待它能自己變好。
而現在,我的選擇是:面對問題,解決問題。
張鵬:我記得你之前提到,你不喜歡學霸的標簽,是因為學霸本質上是要把別人出的題都回答得很好,但其實你想解自己的題。所以百川這次算是終于大聲喊出「自己的議題」了唄?
王小川: 沒錯。創業過程中,一旦有了投資人,一旦置身于某種行業共識之中,你很容易就又回到了一個「公共題庫」里。對我而言,那意味著重蹈覆轍,回到過去那種狀態,而那并非我真正熱愛的事情。
比如,「對標OpenAI」,這就是一個擺在所有人面前的「公開考題」。我們也很習慣性地去「應試」,去解答這道題。
直到今年4月,當我明確提出「為人類造醫生,為生命建模型」的時候——這才是我們為自己出的題目。
張鵬:2023年,國內大模型賽道的玩家,拿到了大額融資。但今天,融資環境會如何影響這些公司?
王小川: 2023年,資本確實給了一波相當可觀的支持。這其中不僅有美元基金,也有來自阿里、騰訊這類產業資本(CVC)的加持。到了2025年,我認為資本環境的不確定性會顯著增加,獲取支持的難度會大得多。
相比之下,美國的資本支持力度依然非常大,這就形成了一種「比較優勢」。在這種優勢下,差距可能會被進一步放大。因此,必須要思考:當中國的資本支持不再充裕時,該如何走下去?
張鵬:「造醫生」是一件復雜且需要長期投入的事。你賬上的資金能為百川智能提供多長的「安全區」?
王小川:我們現在的安全期,長到即便公司完全沒有收入,也可以支撐120個月。所以現在要思考的不是安全問題,而是如何有效的把人和錢變成進步和結果的效率問題。
所以你就理解我們近期的調整,確實不是基于壓力而做出的被動選擇。這是一次發自內心的主動決策,我覺得主動選擇砍掉那些我們不想再做的事情,就是一次比再融一大筆錢更有成果的進展。
03 為什么「造醫生」比追求智能高度,要復雜得多?
張鵬: 百川近期發布的Baichuan-M2模型,表現如何?
王小川:可以說,Baichuan-M2是目前全球最頂尖的醫療開源模型,性能甚至超越了OpenAI新近發布的兩個開源模型。在閉源領域,它的能力也僅次于GPT-5。
OpenAI近來在醫療領域的投入有目共睹。他們新發布的120B和20B兩款開源模型,已經顯示了深厚的基礎設施與工程實力。
在其GPT-5報告中,醫療也是重要部分。OpenAI強調自己的模型是全球唯一在Health-Bench(Hard模式)評測集上得分超過32分的,而Baichuan-M2的分數是34分。同時,在Heath-Bench(標準版)評測中,目前全球也僅有我們的模型與GPT-5突破了60分大關。可以說,在醫療AI這一垂直領域,我們已達到世界級水平。
我們原計劃在8月下旬,與技術報告一同發布。但OpenAI此次不僅是近三年來首次重返開源,而且將焦點對準了醫療。我們內部研判,這是一個關鍵節點,是時候拿出我們的成果,與世界頂尖水平進行一次正面的較量。
在中美科技競爭的宏觀背景下,我們必須承認差距客觀存在。因此在醫療這一關鍵領域,我們選擇開源Baichuan-M2,不僅是為了讓外界對百川的實力有更透明、更深入的認知,更是希望為中國整體的AI創新生態提供一份力量。
此前的M1模型,我們雖已在醫療領域有所布局,但尚未完全聚焦。因此,M2的發布意義非凡——它標志著百川的戰略重心,從「全線出擊」轉向「聚焦醫療」后的第一次亮相。
張鵬:在這個時間點發布M2模型,本質上是讓大家重新認識百川。你會如何定義百川真正要做的事,以及你們在技術路線上的成長目標?
王小川: 我們要在模型層面,做到醫療突出,同時通用能力保持在第一梯隊。
這其實是我們一直以來的一個念想,但在過去,坦白說,「醫療突出」這一點我們是沒能完全做到的。而今天,我們開始真正地做到了。
這相當于我們「換了個身位」。過去,我們和大家在同一個戰壕里,在各種通用大模型的榜單(比如MAU)里打滾,試圖在混戰中找到自己的定位。而現在,M2的發布,是我們找到自己新定位之后的第一次正式亮相。
接下來,在今年內,我們會陸續發布面向醫生和普通用戶的產品。
所以,我們規劃了清晰的三條產品線:基礎模型、醫生端產品、大眾端產品。今天的M2,只是我們宏大計劃中的一個起點。
張鵬: 今天我們看到,像GPT-5這樣的通用模型,延伸到醫療時表現得很強大。而百川選擇聚焦于醫療,做出了一個開源的、在性能上「接近」它的專業模型。這個時候,專用模型的獨特價值是什么呢?
王小川:我們的目標,并不僅僅是「接近」,而是要在醫療這個垂直領域,最終超越通用模型的能力。
畢竟醫療不像數學或物理,僅僅依賴邏輯和公式。醫療知識體系中,既包含嚴謹的邏輯推理,也融合了大量獨有的醫學認知,甚至深受政策、法規和臨床指南的影響。
當然,現階段去和大家反復爭論我們「如何」做到這一點,大家也聽不進去的。只有當我們做到,并且是持續地做到,大家才會回過頭來,重新審視并認同我們當初的想法。
這讓我想起了當年深度學習領域兩條著名的技術路線之爭:Bert和GPT。當時,Google憑借其巨大的品牌影響力和行業地位,力推Bert路線,整個學術界和產業界幾乎都聞風而動。大家為什么相信Bert?答案很簡單——「因為它是Google」。直到OpenAI的GPT-3足夠好后,大家才猛然回頭,重新認識并相信GPT路線的巨大潛力。
張鵬:能否幫我們理解一下,以「造醫生」為目標,為什么比單純追求「智能高度」,要復雜得多?
王小川: 今天的模型,普遍缺乏「提問」的能力。 它們的核心是「解題思路」——你提出問題,它給出答案。這或許并非模型發展的核心方向。
其次,像「減少幻覺」是所有大模型共同的課題,但在醫療領域更嚴肅,因為它直接關乎生命健康。我們追求的是「循證醫學」,模型必須能精準、可靠地調用外部知識庫來支持它的每一個判斷。
而這些需求,既不完全在當前通用大模型廠商主攻的技術路線圖上,也無法用現有的技術范式完美解決。這就是我們的機會所在。
更進一步,當模型要真正落地為產品時,你還必須解決一系列應用層的問題:如何符合當地的政策法規?如何融入人文關懷?如何通過Agent架構將其能力進一步提升?
這是一個全鏈路的工程。我們不僅要在底層模型上做得比通用模型更好用,還要在上面疊加厚重的應用層開發,才能最終交付一個真正「可用」的產品。而這些,恰恰是通用模型公司缺少的。
張鵬:在你看來,要「造醫生」,還有哪幾個最關鍵、最核心的問題,是目前行業沒有解決,百川正在做的?
王小川: 首先,就是我們剛才提到的「提問」與「幻覺」,我們正在做,這是一部分。另外,
一個「好醫生」,遠不止于此。它要有記憶力,能記住你的病史。同時,醫生不僅要與患者溝通,更要懂得如何與患者家屬溝通,理解并處理這些復雜的人際關系。這些是通用模型在設計時根本不會去深入思考的問題。
所以,我們的路徑是:在底層,死磕「提問」與「循證」;在應用層,則要賦予模型更好的記憶和對關系的理解。
張鵬: 你其實是在智能的高度之上,疊加了多個嚴苛的約束和目標?
王小川: 對。甚至我們還可以繼續向下延伸,比如在慢病管理和長期健康追蹤等場景中,都存在著大量的技術問題和用戶需求洞察需要去解決。
04 AI家庭醫生,將比無人駕駛更早到來
張鵬:從你的視角看,從技術基本就緒,到我們每個人都能擁有一個AI驅動的私人家庭醫生,這條時間線你會如何預期?王小川: 我認為,它會比無人駕駛更早到來。
張鵬: 這個判斷很有意思。為什么?
王小川: 我們明年(2026年)會推出大的版本迭代,它的技術成熟已經肉眼可見。
將造醫生與無人駕駛對比,有很多相似性。因為大眾普遍認為,他們都與生命安全直接相關的,都很棘手。
但相比無人駕駛,造醫生更容易落地,第一個是因為無人駕駛并非絕對剛需,沒有AI司機,你依然可以自己開車。但醫療不同,沒有醫生,你自己無法給自己看病。
第二個是,無人駕駛的「人機協同」問題。我們知道,測試無人駕駛汽車的安全員,需要時刻保持精力高度緊張,隨時準備接管,其勞動強度遠超普通司機。因為一旦系統失靈,留給人的反應時間可能只有短短兩秒。
但AI醫生和人類醫生可以形成非常高效、安全的分工協作。 AI給出的診斷報告或治療方案,可以由人類醫生進行最終審核。更重要的是,在廣闊的院外場景,AI醫生完全可以獨立工作,因為它不直接涉及開具處方。
這里,我們內部有一個洞察:能夠改變用戶行為,就是在創造價值。 價值不一定只體現在「診斷」和「開藥」。
比如,當好幾位醫生給了你不同的建議時,你該聽誰的?當你家人生病時,你是否應該立刻送往醫院?這些大量的、關鍵的決策,本身就蘊含著巨大的醫療價值。在這些場景中,AI醫生可以獨立發揮作用,甚至無需人類醫生配合。
張鵬:我們此前曾用自動駕駛的L1到L5等級,來類比「造醫生」的過程。今天,你對這個分層有新的迭代與思考嗎?
王小川:今天我確實有了一些新的思考。過去我們套用自動駕駛的邏輯:L1仍需人工主導;L2能在單任務上獨立工作;L3轉為機器主導、人類輔助,并處理多任務(如同時開具處方和撰寫病歷);L4則基本實現全程自動化,人類僅作為監督。
這個分層邏輯,本質上仍是從單一維度,即機器自身的能力來劃分的。
但我今天認為,醫療的演進需要引入額外的維度,比如場景,院內還是院外?「院外」場景,就像是「低速無人駕駛」。這個市場空間廣闊,需求雖不像院內那樣要求「一錘定音」式的高精尖,但其輔助價值巨大。
第二個新維度,是「關系」。醫療決策不僅是面向患者,更需要與家屬溝通,這其中蘊含著深厚的人文關懷。我們常說一個詞叫「嘴替」。比如,子女直接勸說父母關注健康問題,他們可能不聽;但換成醫生的身份,他們聽從的意愿會顯著提高。
張鵬:最近,大廠們紛紛開始布局AI醫療。你覺得百川智能又進入他們的射程之內了嗎?
王小川: 我們做的是完全不一樣的事。第一個,我們的目標是「造醫生」,而不是一個簡單的「健康顧問」。
其次,把產品形態做成一個小程序或一個APP,不是醫生應該有的形態。醫生,就應該有醫生的形態。當你把它做成一個APP時,用戶潛意識里就已經不把它當「人」看了。 這里邊一個是關系,一個是使用習慣得一致。今天,行業里絕大多數公司在做AI醫生時,其核心訴求依然是「降本增效」。他們把AI當成一個提升效率的工具,嵌入在原有的APP邏輯里,追求的還是日活躍用戶(DAU)之類的指標。他們沒有把AI當成一個「人」來看待。
張鵬: 你提到,明年我們或許就能親身體驗到「百川造醫生」的進展。能否提前描繪一下,我們應該抱一個怎樣的「正確預期」?
王小川: 我相信大家都能想象擁有一個私人醫療顧問的場景,這似乎是行業的共識。但屆時你會發現,百川的思路與市面上其他做AI醫生的公司,截然不同。
但我最近還是進步了一點,覺得預期管理這件事最簡單的方法就是做到再說,所以我現在就先不講太多了。
張鵬: 我猜想,你的最終目標是讓服務直達用戶和家庭,而非僅僅嵌入醫院的某個流程體系?
王小川: 是的。我們的第一步是先進入醫院體系,獲得專業的認同與背書。到明年,我們就會將服務直接推向消費者(C端)。