關于ZAKER 合作
      鈦媒體 剛剛

      大模型競爭的下半場,為何場景為王?

      圖片系 AI 生成

      場景的深度與廣度正成為大模型價值的真正標尺。

      2025 年 4 月發布的斯坦福 AI 指數報告,揭示了一些有趣的事實。2024 年,TOP1 和 TOP10 的模型的差距為 12%,但如今,它們的差距已經銳減至 5%。

      這說明頭部模型的效果沒有本質差別,大模型的進化已經到達瓶頸期,與此同時,頂級模型能力也不再被小部分人壟斷。隨之變化的還有成本和參數等層面。與兩年前相比,38 億參數的小模型就能實現之前 5400 億參數模型的效果。

      在大規模多任務語言理解(MMLU)基準測試中達到 GPT-3.5 水平(MMLU 準確率 64.8%)的 AI 模型調用成本,已從 2022 年 11 月的 20 美元 / 每百萬 token,驟降至 2024 年 10 月的 0.07 美元 / 每百萬 token(谷歌 DeepMind 的 Gemini-1.5-Flash-8B 模型),18 個月內成本下降 280 倍。

      當模型能力不再是壁壘,場景穿透力成為新的競爭維度。單純刷榜失去意義,不論大廠還是初創,都在尋找垂直場景深度、邏輯可靠性與終端適配性,本質上是在某一個具體的場景中,驗證 " 效率 - 性能 - 安全 " 的三角平衡。

      而就鈦媒體接觸和收集到的場景來看,過去三年,也呈現出明顯從「技術試水」到「價值深耕」的過渡。

      2023-2024 年是通用場景的探索期,以技術驗證為主,主流大模型聚焦通用能力測試,文本生成、多模態交互等,主要應用于內容創作等場景,而在一些亟需確定性的場景,能力稍顯不足。

      某銀行引入通用模型后,反欺詐誤報率居高不下,反映出早期模型在專業場景水土不服;某醫院的人工輔助診療,強依賴人工標注數據,且 NMPA 審批周期長,商業化進程緩慢;大模型的訓練需高額投入,導致多數企業處于觀望狀態,僅頭部機構能承擔技術驗證成本。

      大模型場景的閉環系統尚未跑通,諸多要素不健全,這也是技術發展的必經之路,到了今年則有很大不同。

      " 空有模型無用,甚至一些企業認為模型應該是免費的,他們開放了核心生產場景和模型廠商共創,模型廠商才是需求更迫切的一方。" 一位大型企業高管表示。" 無場景支撐的通用模型,正面臨用戶留存低、付費意愿弱的商業化困局。"

      在剛剛落幕的 2025 年全球數字經濟大會上,北京正式揭曉了 2025 年人工智能應用場景 " 揭榜掛帥 " 名單,共涉及 12 個領域,包括制造業、教育、醫療、金融、環境、能源、文旅、智慧水廠、街道安全、建筑以及智慧城市等,總預算金額高達 1.1 億元。

      上至政策制定方,下至業務需求方,大模型產業要向前,都在把大模型推到千行百業的場景中。

      鈦媒體 App 將大模型應用場景分成三類,首先是短期收益明確的 " 效率型 " 場景,例如私有化部署 + RAG(檢索增強生成)做企業知識庫,解決數據安全與幻覺問題,再如之前已有的算法場景優化,供應鏈的周轉優化,智能制造的預測性維護等,這些場景入手容易,產出可見,是多數企業小規模試驗的優先選擇。

      其次是需求爆發中的 " 創造力型 " 場景,例如多模態生成技術(文生圖、文生視頻),可將游戲素材制作成本大幅降低,AI Agent 驅動游戲 NPC 動態交互,提高玩家留存率

      最后是最難的,長周期高門檻的 " 復雜系統型 " 場景,比如醫療健康的輔助診斷,需跨域融合基因數據、影像學知識,政策合規要求高,再如自動駕駛,依賴 VLM(視覺語言模型)與端到端算法融合,技術成熟度與法規滯后制約商業化,價值足夠大,卻也是難啃的骨頭。

      鈦媒體從 2023 年初,就持續關注場景應用,創設《創新場景 50》欄目,挖掘、報道市面上真正有價值的技術場景。綜合去年「創新場景 50」系列榜單,鈦媒體發現了幾個趨勢,首先,大模型創新場景處于淺層、實驗性、內部場景居多,深層、規模化、外部場景較少。

      但也有一些不錯的場景出現。例如首旅用大模型為 6300 家酒店客房精準定價;大模型智能體應用 " 閨蜜 AI 醫生 ",女性用戶問答準確率達 80%;借助大模型技術,貨運物流智能接單效率提升 75%;基于大模型的深基坑風險管理 Agent,提高管控效率和準確率;大模型落地場外衍生品交易場景,撮合成功率增長 3 倍,等等創新場景。

      此外,我們明顯看到了中大型企業和政府等行業的進展,在宏觀經濟的逆周期,以及所處行業環境的大背景下,更多企業迫于外力加速了創新場景的實踐,論投入產出比,論直接和間接效果,數字化投入帶來的回報都在優先級之列。

      最后,創新場景領先者給與我們的反饋是,場景創新其實一直都在發生,應當成為企業的數字化慣性,而不是數字化沖動,不論創新場景的大和小、深和淺,及早實踐最重要。

      在我們看來,變化的是技術,不變的是需求,大模型必然會走向場景為王,并將在千行百業中兌現價值,這將是未來較長一段時間的主線。大模型時代的創新場景應該是什么樣?行業都在摸索中前行,我們希望聽到更多真實的聲音。

      2024 創新場景的獲獎企業各有各的特色,集合往年優秀創新場景參與方的后續發展來看,除了能得到廣闊的曝光,還有機會登上更大的舞臺。例如去年創新場景獲獎企業中能坤域,旗下低空全自動充電機器人開創性地實現了 " 機器人找車 " 的主動服務模式,入選央視《贏在 AI+》并晉級全國總決賽。

      創新場景的評審方包括各大企業 CXO 級別技術和管理層,他們將為行業厘清真實的發展脈絡。鈦媒體將鏈接更多渠道和資源推廣創新場景,讓更好的創新場景,先一步被看見、發掘和變現。在評選中脫穎而出的獲獎創新場景,更將獲得鈦媒體矩陣持續曝光,包括內容層面的宣傳,以及參與鈦媒體全年各種含金量極高活動的潛在合作機會。

      2025 年度「創新場景 TOP 50」榜單評選征集啟動

      將面向國內從事企業數字化與人工智能相關的技術 / 服務 / 產品應用的企業或科研機構,征集場景解決方案。

      備注說明:場景案例對應的產品或服務需已實際落地,并具有創新性和示范性。

      【評選周期】

      申報日期:

      2025 年 7 月 8 日起 ~8 月 22 日止

      公開投票及專家評審:

      2025 年 8 月 23 日起 ~8 月 31 日止

      申報鏈接:https://m.tmtpost.com/post/cj50

      申報相關問題請掃碼添加工作人員微信

      覺得文章不錯,微信掃描分享好友

      掃碼分享
      主站蜘蛛池模板: 亚洲AV成人一区二区三区观看 | 无码国产精品一区二区免费式影视 | 日韩精品一区二区午夜成人版| 国产午夜精品一区理论片飘花| 日韩精品无码视频一区二区蜜桃 | 亚洲第一区视频在线观看| 日本免费一区二区三区最新vr| 内射女校花一区二区三区| 精品一区二区三区3d动漫| 国产高清一区二区三区| 一区二区三区日韩精品| 亚洲色欲一区二区三区在线观看| 北岛玲在线一区二区| 无码中文人妻在线一区二区三区| 成人免费区一区二区三区| 一区二区三区杨幂在线观看| 日韩高清一区二区| 成人国产精品一区二区网站公司| 51视频国产精品一区二区| 国产亚洲福利精品一区| 一区二区视频免费观看| 美女免费视频一区二区| 精品一区二区三区免费毛片| 国产aⅴ精品一区二区三区久久| 国产色欲AV一区二区三区| 日本精品一区二区三本中文| 波多野结衣在线观看一区 | 污污内射在线观看一区二区少妇 | 亚洲日韩中文字幕无码一区| 日韩免费一区二区三区在线播放| AA区一区二区三无码精片| 亚洲中文字幕一区精品自拍| 国产一区二区不卡老阿姨| 国产一区二区三区美女| 国产福利电影一区二区三区久久老子无码午夜伦不 | 国产日韩一区二区三免费高清 | 无码人妻精一区二区三区| 国产婷婷色一区二区三区深爱网 | 国产麻豆精品一区二区三区v视界 国产美女精品一区二区三区 | 久久99国产精一区二区三区| 国产伦精品一区二区三区|