<rt id="60wci"></rt>

鈦媒體 12小時前

大模型競爭的下半場，為何場景為王？

圖片系 AI 生成

場景的深度與廣度正成為大模型價值的真正標尺。

2025 年 4 月發布的斯坦福 AI 指數報告，揭示了一些有趣的事實。2024 年，TOP1 和 TOP10 的模型的差距為 12%，但如今，它們的差距已經銳減至 5%。

這說明頭部模型的效果沒有本質差別，大模型的進化已經到達瓶頸期，與此同時，頂級模型能力也不再被小部分人壟斷。隨之變化的還有成本和參數等層面。與兩年前相比，38 億參數的小模型就能實現之前 5400 億參數模型的效果。

在大規模多任務語言理解（MMLU）基準測試中達到 GPT-3.5 水平（MMLU 準確率 64.8%）的 AI 模型調用成本，已從 2022 年 11 月的 20 美元 / 每百萬 token，驟降至 2024 年 10 月的 0.07 美元 / 每百萬 token（谷歌 DeepMind 的 Gemini-1.5-Flash-8B 模型），18 個月內成本下降 280 倍。

當模型能力不再是壁壘，場景穿透力成為新的競爭維度。單純刷榜失去意義，不論大廠還是初創，都在尋找垂直場景深度、邏輯可靠性與終端適配性，本質上是在某一個具體的場景中，驗證 " 效率 - 性能 - 安全 " 的三角平衡。

而就鈦媒體接觸和收集到的場景來看，過去三年，也呈現出明顯從「技術試水」到「價值深耕」的過渡。

2023-2024 年是通用場景的探索期，以技術驗證為主，主流大模型聚焦通用能力測試，文本生成、多模態交互等，主要應用于內容創作等場景，而在一些亟需確定性的場景，能力稍顯不足。

某銀行引入通用模型后，反欺詐誤報率居高不下，反映出早期模型在專業場景水土不服；某醫院的人工輔助診療，強依賴人工標注數據，且 NMPA 審批周期長，商業化進程緩慢；大模型的訓練需高額投入，導致多數企業處于觀望狀態，僅頭部機構能承擔技術驗證成本。

大模型場景的閉環系統尚未跑通，諸多要素不健全，這也是技術發展的必經之路，到了今年則有很大不同。

" 空有模型無用，甚至一些企業認為模型應該是免費的，他們開放了核心生產場景和模型廠商共創，模型廠商才是需求更迫切的一方。" 一位大型企業高管表示。" 無場景支撐的通用模型，正面臨用戶留存低、付費意愿弱的商業化困局。"

在剛剛落幕的 2025 年全球數字經濟大會上，北京正式揭曉了 2025 年人工智能應用場景 " 揭榜掛帥 " 名單，共涉及 12 個領域，包括制造業、教育、醫療、金融、環境、能源、文旅、智慧水廠、街道安全、建筑以及智慧城市等，總預算金額高達 1.1 億元。

上至政策制定方，下至業務需求方，大模型產業要向前，都在把大模型推到千行百業的場景中。

鈦媒體 App 將大模型應用場景分成三類，首先是短期收益明確的 " 效率型 " 場景，例如私有化部署 + RAG（檢索增強生成）做企業知識庫，解決數據安全與幻覺問題，再如之前已有的算法場景優化，供應鏈的周轉優化，智能制造的預測性維護等，這些場景入手容易，產出可見，是多數企業小規模試驗的優先選擇。

其次是需求爆發中的 " 創造力型 " 場景，例如多模態生成技術（文生圖、文生視頻），可將游戲素材制作成本大幅降低，AI Agent 驅動游戲 NPC 動態交互，提高玩家留存率

最后是最難的，長周期高門檻的 " 復雜系統型 " 場景，比如醫療健康的輔助診斷，需跨域融合基因數據、影像學知識，政策合規要求高，再如自動駕駛，依賴 VLM（視覺語言模型）與端到端算法融合，技術成熟度與法規滯后制約商業化，價值足夠大，卻也是難啃的骨頭。

鈦媒體從 2023 年初，就持續關注場景應用，創設《創新場景 50》欄目，挖掘、報道市面上真正有價值的技術場景。綜合去年「創新場景 50」系列榜單，鈦媒體發現了幾個趨勢，首先，大模型創新場景處于淺層、實驗性、內部場景居多，深層、規模化、外部場景較少。

但也有一些不錯的場景出現。例如首旅用大模型為 6300 家酒店客房精準定價；大模型智能體應用 " 閨蜜 AI 醫生 "，女性用戶問答準確率達 80%；借助大模型技術，貨運物流智能接單效率提升 75%；基于大模型的深基坑風險管理 Agent，提高管控效率和準確率；大模型落地場外衍生品交易場景，撮合成功率增長 3 倍，等等創新場景。

此外，我們明顯看到了中大型企業和政府等行業的進展，在宏觀經濟的逆周期，以及所處行業環境的大背景下，更多企業迫于外力加速了創新場景的實踐，論投入產出比，論直接和間接效果，數字化投入帶來的回報都在優先級之列。

最后，創新場景領先者給與我們的反饋是，場景創新其實一直都在發生，應當成為企業的數字化慣性，而不是數字化沖動，不論創新場景的大和小、深和淺，及早實踐最重要。

在我們看來，變化的是技術，不變的是需求，大模型必然會走向場景為王，并將在千行百業中兌現價值，這將是未來較長一段時間的主線。大模型時代的創新場景應該是什么樣？行業都在摸索中前行，我們希望聽到更多真實的聲音。

2024 創新場景的獲獎企業各有各的特色，集合往年優秀創新場景參與方的后續發展來看，除了能得到廣闊的曝光，還有機會登上更大的舞臺。例如去年創新場景獲獎企業中能坤域，旗下低空全自動充電機器人開創性地實現了 " 機器人找車 " 的主動服務模式，入選央視《贏在 AI+》并晉級全國總決賽。

創新場景的評審方包括各大企業 CXO 級別技術和管理層，他們將為行業厘清真實的發展脈絡。鈦媒體將鏈接更多渠道和資源推廣創新場景，讓更好的創新場景，先一步被看見、發掘和變現。在評選中脫穎而出的獲獎創新場景，更將獲得鈦媒體矩陣持續曝光，包括內容層面的宣傳，以及參與鈦媒體全年各種含金量極高活動的潛在合作機會。

2025 年度「創新場景 TOP 50」榜單評選征集啟動

將面向國內從事企業數字化與人工智能相關的技術 / 服務 / 產品應用的企業或科研機構，征集場景解決方案。

備注說明：場景案例對應的產品或服務需已實際落地，并具有創新性和示范性。

【評選周期】

申報日期：

2025 年 7 月 8 日起 ~8 月 22 日止

公開投票及專家評審：

2025 年 8 月 23 日起 ~8 月 31 日止

申報鏈接：https://m.tmtpost.com/post/cj50

申報相關問題請掃碼添加工作人員微信

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關標簽

ai 人工智能機器人

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

大模型競爭的下半場，為何場景為王？

宙世代

一起剪

相關閱讀

沒打嘴炮！小鵬兌現60天賬期承諾 多家供應商收到簽署補充協議郵件

華為云桌面連續九年第一！中國虛擬桌面軟件市場無敵手

茶飲的商業模式，越來越像共享單車

京東造車成功，劉強東下了一盤大棋

REDMI K80推送澎湃OS 2正式版內測更新 穩定性全面提升

微信朋友圈評論區能發表情包和圖片：緩存可清理 不會太占用存儲空間

男性占8成 “僅退款群體畫像”上熱搜 網友質疑數據真實性

馬蜂窩攻略定制產品“AI路書”正式向所有用戶開放

Grok 4 登場，馬斯克親自解讀超級AI的誕生

微軟反復橫跳！再一次恢復Edge被移除的云母Mica效果

染發的盡頭是五彩斑斕的黑

前百川聯創焦可新創業公司曝光，新項目已上線 App Store

“大圣同款”泳衣賣爆了 商家：預售排長隊 眾網友很想試試

你認同嗎！吳曉波：月收入3萬以下不要買車 壓力太大也不用買房

太科幻！我國科學家首次實現小鼠全身“高清全景成像”：單根神經纖維清晰可見

最新評論

鈦媒體

熱門推薦

沒打嘴炮！小鵬兌現60天賬期承諾多家供應商收到簽署補充協議郵件

REDMI K80推送澎湃OS 2正式版內測更新穩定性全面提升

微信朋友圈評論區能發表情包和圖片：緩存可清理不會太占用存儲空間

男性占8成 “僅退款群體畫像”上熱搜網友質疑數據真實性

“大圣同款”泳衣賣爆了商家：預售排長隊眾網友很想試試

你認同嗎！吳曉波：月收入3萬以下不要買車壓力太大也不用買房