關于ZAKER 合作
      鈦媒體 剛剛

      王小川的百川智能開源全新醫療增強大模型,部署成本比 DeepSeek 降低 57 倍

      百川智能創始人、CEO 王小川

      時隔許久,王小川創立的百川智能公布最新模型技術進展。

      8 月 11 日消息,百川智能今天發布一款開源的醫療增強大模型 Baichuan-M2。

      具體來說,針對醫療領域用戶隱私考慮下的模型私有化部署需求,百川智能對 Baichuan-M2 進行了極致輕量化,量化后的模型精度接近無損,可以在 RTX4090 上單卡部署,相比 DeepSeek-R1 H20 雙節點部署的方式,成本降低了 57 倍。針對國產主流芯片的開發和適配,讓多數醫療機構利用現有硬件條件可以實現快速部署。

      評分上,Baichuan-M2 在 HealthBench 上得到 60.1 的高分,以 32B 的較小尺寸不僅反超 OpenAI 最新開源模型 gpt-oss120b(得分 57.6),超過 Qwen3-235B、Deepseek R1、Kimi K2 等其他開源大模型,略遜于 GPT-5-Thinking。

      百川智能表示,GPT-5 發布時既沒有開源,也沒有公布參數,無法私有化部署,無法低成本應用。相比之下,Baichuan-M2 快速免費開源,成為醫療行業低成本快速應用部署世界頂尖醫療模型的唯一選擇。

      據悉,百川智能成立于 2023 年 3 月,由原搜狗公司 CEO 王小川創立,團隊成員主要來自搜狗、谷歌、騰訊、百度、微軟、字節等公司。目前,百川智能已完成三輪融資,2024 年 7 月獲得了 50 億元的 A 輪融資,并將以 200 億元估值開啟 B 輪融資,是中國 AI" 大模型六虎 " 之一。

      今年以來,百川智能全面做 "AI 醫生 "。

      王小川稱,醫療大模型是 LLM 皇冠上的明珠,AI 醫療不僅能提升醫療服務的可及性、便利性,還將推動醫療研究范式的創新。在智能時代,我們不是在造 " 工具 " 而是在 " 造人 ",造人代表了知識含量最高,并且需求最廣泛,而醫療則是其中最有代表性的行業。神經網絡之父辛頓(Hinton)也強調了醫療的重要性,認為 " 醫療行業是 AI 應用中最重要的領域之一,能最大化發揮 AI 的潛力 "。

      " 為生命建模型、為人類造醫生,是百川的使命。這是第一天就立下的志向。" 王小川曾指出,百川智能是國內唯一一個專注醫療的大模型創業公司。其在 2021 年把搜狗公司賣給騰訊的時候就提到,之后的二十年我會專注生命科學、大眾健康。2022 年,他創建了一家做 AI 檢驗檢測設備的公司——五季醫學,它和百川智能實際上是姊妹公司。

      今年 1 月,百川智能推出國內首個具備語言、視覺和搜索三大推理能力的開源全場景模型 Baichuan-M1-preview,特別解鎖了醫療循證模式,可整合實時醫學證據進行深度推理,同期開源的 Baichuan-M1-14B 醫療增強模型,在臨床評測中表現媲美主流大模型(如 o1-mini)。

      同時,百川 Baichuan-M1-preview 內置行業內首發的 "AI 患者模擬器 ",用真實數據構造上萬個不同年齡性別癥狀的 AI 患者,模擬了數百萬次診療過程。

      今年 2 月,以 Baichuan M1 大模型為底座打造的 "AI 兒科醫生 " 正式在北京兒童醫院上崗;今年 3 月,百川攜手北京兒童醫院、小兒方健康共同發布 " 福棠 · 百川 " 兒科大模型。

      時隔 8 個月后,百川智能發布全新大模型產品,升級患者模擬器并引入模型端到端強化學習(RL)能力。

      百川智能表示,面向急診、門診等對于交互速度要求更高的場景,相比 Baichuan-M1,基于 Eagle-3 架構優化的 Baichuan-M2 MTP 版本在單用戶場景下實現了 58.5% 的 token 速度躍升。

      實際上,OpenAI 于 8 月 6 日首次開源兩款大模型,主打部署成本超低和醫療能力最強。其中,開源 gpt-oss 系列模型過程中,OpenAI 首次將醫療作為第一重要的評測標準;發布 GPT-5 時,請到現場的唯一使用者是抗癌患者。

      據悉,OpenAI 從 HealthBench 整體數據中選出 1000 個特別困難復雜問題作為 Hard 子集,用于驗證模型多維度、全景化解決疑難復雜醫學問題的能力。今年 5 月這個評測集發布時,世界上所有頂尖模型得分都沒超過 32 分,許多前沿模型得分甚至為 0。在 OpenAI 組織的人類資深醫生測試中,資深醫生撰寫的答案甚至未超過 o3。

      OpenAI 在 GPT-5 發布時特別強調,其是 HealthBench Hard 評測全球唯一超過 32 分的模型。而百川智能表示,Baichuan-M2 以 34.7 分成為全球第二款超過 32 分的模型。

      案例方面,百川智能稱,在北京市海淀區衛健委、北京大學第三醫院、國家兒童醫學中心等合作伙伴的支持下,M2 在真實病例實測中體現出超強能力。例如,一位 51 歲女士近兩個月睡眠充足仍感覺困倦、疲憊,脖子輕微腫脹。M2 根據醫患對話,詳細梳理出持續性疲勞、體重增加等多個支持診斷的關鍵癥狀,綜合考慮患者用藥史、年齡、合并癥狀等因素,精準診斷出患者最可能病因為甲狀腺功能減退癥。

      事實上,近期,螞蟻、字節等大廠都在布局 "AI 醫生 " 這一前沿產業賽道。

      其中,7 月初,字節跳動推出首個 AI 醫療助手獨立 App" 小荷 AI 醫生 ",主打健康咨詢與報告解讀功能;而螞蟻集團也上線獨立健康應用 "AQ",加速布局 AI 醫療賽道。

      據弗若斯特沙利文預測,中國 AI 醫療市場規模將從 2023 年的 88 億元,快速增長至 2033 年的 3157 億元,年復合增長率高達 43.1%。(本文首發于鈦媒體 App,作者|林志佳,編輯|蓋虹達)

      相關標簽
      主站蜘蛛池模板: 四虎永久在线精品免费一区二区| 中文乱码人妻系列一区二区| 国产成人无码一区二区在线观看| 亚洲午夜日韩高清一区| 久久精品免费一区二区喷潮| 亚洲无线码一区二区三区| 99精品国产一区二区三区2021| 国产天堂一区二区综合| 无码一区二区三区AV免费| 熟妇人妻AV无码一区二区三区| 韩国精品福利一区二区三区| 亚无码乱人伦一区二区| 国产在线视频一区二区三区98| 精品免费久久久久国产一区| 能在线观看的一区二区三区| 免费无码A片一区二三区| 亚洲香蕉久久一区二区三区四区| 国产一区二区精品久久岳| 精品人妻一区二区三区四区| 冲田杏梨AV一区二区三区| 国产精品成人免费一区二区| 蜜臀AV在线播放一区二区三区| 国产精品女同一区二区| 精品乱子伦一区二区三区高清免费播放| 日本精品无码一区二区三区久久久| 亚洲一区二区三区91| 少妇无码一区二区二三区| 亚洲欧洲∨国产一区二区三区| 国精品无码一区二区三区在线蜜臀| 国产在线视频一区二区三区98| 国产成人无码一区二区在线观看| 亚洲国产综合无码一区 | 福利国产微拍广场一区视频在线| 亚洲国产成人精品无码一区二区 | 欧洲亚洲综合一区二区三区| 国产一区二区好的精华液 | 免费一本色道久久一区| 亚洲AV无码一区二区三区牲色 | 亚洲国产精品综合一区在线| 色欲AV蜜桃一区二区三| 精品国产一区二区三区在线|