關于ZAKER 合作
      鈦媒體 12小時前

      大模型競爭的下半場,為何場景為王?

      圖片系 AI 生成

      場景的深度與廣度正成為大模型價值的真正標尺。

      2025 年 4 月發布的斯坦福 AI 指數報告,揭示了一些有趣的事實。2024 年,TOP1 和 TOP10 的模型的差距為 12%,但如今,它們的差距已經銳減至 5%。

      這說明頭部模型的效果沒有本質差別,大模型的進化已經到達瓶頸期,與此同時,頂級模型能力也不再被小部分人壟斷。隨之變化的還有成本和參數等層面。與兩年前相比,38 億參數的小模型就能實現之前 5400 億參數模型的效果。

      在大規模多任務語言理解(MMLU)基準測試中達到 GPT-3.5 水平(MMLU 準確率 64.8%)的 AI 模型調用成本,已從 2022 年 11 月的 20 美元 / 每百萬 token,驟降至 2024 年 10 月的 0.07 美元 / 每百萬 token(谷歌 DeepMind 的 Gemini-1.5-Flash-8B 模型),18 個月內成本下降 280 倍。

      當模型能力不再是壁壘,場景穿透力成為新的競爭維度。單純刷榜失去意義,不論大廠還是初創,都在尋找垂直場景深度、邏輯可靠性與終端適配性,本質上是在某一個具體的場景中,驗證 " 效率 - 性能 - 安全 " 的三角平衡。

      而就鈦媒體接觸和收集到的場景來看,過去三年,也呈現出明顯從「技術試水」到「價值深耕」的過渡。

      2023-2024 年是通用場景的探索期,以技術驗證為主,主流大模型聚焦通用能力測試,文本生成、多模態交互等,主要應用于內容創作等場景,而在一些亟需確定性的場景,能力稍顯不足。

      某銀行引入通用模型后,反欺詐誤報率居高不下,反映出早期模型在專業場景水土不服;某醫院的人工輔助診療,強依賴人工標注數據,且 NMPA 審批周期長,商業化進程緩慢;大模型的訓練需高額投入,導致多數企業處于觀望狀態,僅頭部機構能承擔技術驗證成本。

      大模型場景的閉環系統尚未跑通,諸多要素不健全,這也是技術發展的必經之路,到了今年則有很大不同。

      " 空有模型無用,甚至一些企業認為模型應該是免費的,他們開放了核心生產場景和模型廠商共創,模型廠商才是需求更迫切的一方。" 一位大型企業高管表示。" 無場景支撐的通用模型,正面臨用戶留存低、付費意愿弱的商業化困局。"

      在剛剛落幕的 2025 年全球數字經濟大會上,北京正式揭曉了 2025 年人工智能應用場景 " 揭榜掛帥 " 名單,共涉及 12 個領域,包括制造業、教育、醫療、金融、環境、能源、文旅、智慧水廠、街道安全、建筑以及智慧城市等,總預算金額高達 1.1 億元。

      上至政策制定方,下至業務需求方,大模型產業要向前,都在把大模型推到千行百業的場景中。

      鈦媒體 App 將大模型應用場景分成三類,首先是短期收益明確的 " 效率型 " 場景,例如私有化部署 + RAG(檢索增強生成)做企業知識庫,解決數據安全與幻覺問題,再如之前已有的算法場景優化,供應鏈的周轉優化,智能制造的預測性維護等,這些場景入手容易,產出可見,是多數企業小規模試驗的優先選擇。

      其次是需求爆發中的 " 創造力型 " 場景,例如多模態生成技術(文生圖、文生視頻),可將游戲素材制作成本大幅降低,AI Agent 驅動游戲 NPC 動態交互,提高玩家留存率

      最后是最難的,長周期高門檻的 " 復雜系統型 " 場景,比如醫療健康的輔助診斷,需跨域融合基因數據、影像學知識,政策合規要求高,再如自動駕駛,依賴 VLM(視覺語言模型)與端到端算法融合,技術成熟度與法規滯后制約商業化,價值足夠大,卻也是難啃的骨頭。

      鈦媒體從 2023 年初,就持續關注場景應用,創設《創新場景 50》欄目,挖掘、報道市面上真正有價值的技術場景。綜合去年「創新場景 50」系列榜單,鈦媒體發現了幾個趨勢,首先,大模型創新場景處于淺層、實驗性、內部場景居多,深層、規模化、外部場景較少。

      但也有一些不錯的場景出現。例如首旅用大模型為 6300 家酒店客房精準定價;大模型智能體應用 " 閨蜜 AI 醫生 ",女性用戶問答準確率達 80%;借助大模型技術,貨運物流智能接單效率提升 75%;基于大模型的深基坑風險管理 Agent,提高管控效率和準確率;大模型落地場外衍生品交易場景,撮合成功率增長 3 倍,等等創新場景。

      此外,我們明顯看到了中大型企業和政府等行業的進展,在宏觀經濟的逆周期,以及所處行業環境的大背景下,更多企業迫于外力加速了創新場景的實踐,論投入產出比,論直接和間接效果,數字化投入帶來的回報都在優先級之列。

      最后,創新場景領先者給與我們的反饋是,場景創新其實一直都在發生,應當成為企業的數字化慣性,而不是數字化沖動,不論創新場景的大和小、深和淺,及早實踐最重要。

      在我們看來,變化的是技術,不變的是需求,大模型必然會走向場景為王,并將在千行百業中兌現價值,這將是未來較長一段時間的主線。大模型時代的創新場景應該是什么樣?行業都在摸索中前行,我們希望聽到更多真實的聲音。

      2024 創新場景的獲獎企業各有各的特色,集合往年優秀創新場景參與方的后續發展來看,除了能得到廣闊的曝光,還有機會登上更大的舞臺。例如去年創新場景獲獎企業中能坤域,旗下低空全自動充電機器人開創性地實現了 " 機器人找車 " 的主動服務模式,入選央視《贏在 AI+》并晉級全國總決賽。

      創新場景的評審方包括各大企業 CXO 級別技術和管理層,他們將為行業厘清真實的發展脈絡。鈦媒體將鏈接更多渠道和資源推廣創新場景,讓更好的創新場景,先一步被看見、發掘和變現。在評選中脫穎而出的獲獎創新場景,更將獲得鈦媒體矩陣持續曝光,包括內容層面的宣傳,以及參與鈦媒體全年各種含金量極高活動的潛在合作機會。

      2025 年度「創新場景 TOP 50」榜單評選征集啟動

      將面向國內從事企業數字化與人工智能相關的技術 / 服務 / 產品應用的企業或科研機構,征集場景解決方案。

      備注說明:場景案例對應的產品或服務需已實際落地,并具有創新性和示范性。

      【評選周期】

      申報日期:

      2025 年 7 月 8 日起 ~8 月 22 日止

      公開投票及專家評審:

      2025 年 8 月 23 日起 ~8 月 31 日止

      申報鏈接:https://m.tmtpost.com/post/cj50

      申報相關問題請掃碼添加工作人員微信

      覺得文章不錯,微信掃描分享好友

      掃碼分享
      主站蜘蛛池模板: 国产高清不卡一区二区| AV天堂午夜精品一区二区三区| 亚洲AV无码一区二区三区国产| 日本精品视频一区二区三区| 国产日韩精品一区二区在线观看| 福利在线一区二区| 成人区人妻精品一区二区不卡视频 | 日本一区二区三区精品中文字幕| 消息称老熟妇乱视频一区二区| 无码国产精成人午夜视频一区二区 | 亚洲Av高清一区二区三区| 一本一道波多野结衣一区| 极品少妇伦理一区二区| 无码人妻精品一区二区三区在线 | 国产乱人伦精品一区二区在线观看 | 福利视频一区二区牛牛| 一区二区三区日韩| 精品女同一区二区三区在线| 亚洲日韩精品一区二区三区无码| 久久无码人妻一区二区三区| 精品一区二区三区中文| 一区二区三区视频在线观看| 国产一区在线观看免费| 亚洲日本一区二区| 国产人妖视频一区二区破除| 亚洲国产一区二区三区青草影视 | 亚洲国产综合精品一区在线播放| 蜜桃臀无码内射一区二区三区| 国产产一区二区三区久久毛片国语 | 亚洲一区二区三区91| 成人午夜视频精品一区| 国产福利无码一区在线| 高清一区二区三区免费视频| 日本精品少妇一区二区三区 | 色一乱一伦一区一直爽| 学生妹亚洲一区二区| 丰满爆乳一区二区三区| 后入内射国产一区二区| 亚洲欧美日韩一区二区三区| 精品国产免费一区二区三区香蕉 | 色综合视频一区二区三区44|