天天综合网在线,最近中文字幕免费大全8高清,国产精品一二区

Meta 開源 LlamaFirewall 防護工具，助力構建安全 AI 智能體

IT 之家 5 月 9 日消息，Meta AI 公司最新推出 LlamaFirewall，應對 AI 智能體不斷演變的威脅格局，為生產環境中的 AI 智能體提供系統級安全保護。

隨著大型語言模型（LLMs）嵌入 AI 智能體并被廣泛應用于高權限場景，安全隱患隨之增加。這些智能體可以讀取郵件、生成代碼、調用 API，一旦被惡意利用，后果不堪設想。

傳統的安全機制，如聊天機器人內容審核或硬編碼模型限制，已無法滿足具備廣泛能力的 AI 智能體需求。Meta AI 針對提示注入攻擊、智能體行為與用戶目標不一致、以及不安全的代碼生成三大核心挑戰，開發了 LlamaFirewall。

IT 之家援引博文介紹，LlamaFirewall 采用分層框架，包含三個專門的防護模塊：

PromptGuard 2 是一個基于 BERT 架構的分類器，能實時檢測越獄行為和提示注入，支持多語言輸入，其 86M 參數模型性能強勁，22M 輕量版本則適合低延遲部署。

AlignmentCheck 是一種實驗性審計工具，通過分析智能體內部推理軌跡，確保行為與用戶目標一致，特別擅長檢測間接提示注入。

CodeShield 則是一個靜態分析引擎，檢查 LLM 生成代碼中的不安全模式，支持多種編程語言，能在代碼提交或執行前捕獲 SQL 注入等常見漏洞。

Meta 在 AgentDojo 基準測試中評估了 LlamaFirewall，模擬了 97 個任務領域的提示注入攻擊。

結果顯示，PromptGuard 2（86M）將攻擊成功率（ASR）從 17.6% 降至 7.5%，任務實用性損失極小；AlignmentCheck 進一步將 ASR 降至 2.9%；整體系統將 ASR 降低 90% 至 1.75%，實用性略降至 42.7%。CodeShield 在不安全代碼數據集上也表現出色，精準度達 96%，召回率（recall） 79%，響應時間適合生產環境實時使用。

東芝：歐洲不需要24TB硬盤

快科技 3小時前

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

Meta 開源 LlamaFirewall 防護工具，助力構建安全 AI 智能體

宙世代

一起剪

相關閱讀

哪吒汽車有錢了？將償還近5000萬元欠款

曝榮耀400將推國內特供版 配備金屬中框配置也升級

差了2GB/s！Intel酷睿Ultra 200S搭配Z890跑不滿PCIe5.0 SSD

微星游戲本RTX5070新品新配置來襲，神影系列國補到手價7999起開賣！

AOKZOE A1X 掌機首發4844元起：頂配銳龍AI 9 HX 370旗艦芯

英矽智能再沖港交所：AI制藥光環下的長跑者，能否跨越“死亡之谷”？

東芝：歐洲不需要24TB硬盤

智象未來研發成果虛擬試衣領域技術被ICLR 2025收錄

TCL卷入AI浪潮

華為分布式存儲創始團隊創業，去年營收超3倍增長，「泛聯信息」獲數千萬元融資

國內監控攝像頭第一季度銷量如何 小米成電商霸主 銷量、銷額雙第一！

窗口期過后，供應商們怎么打淘汰賽?

天貓618第一波預售于5月13日晚開啟

騰訊混元發布并開源視頻生成工具HunyuanCustom

史上首次千億級家電巨頭戰略合作 海信美的如何“各取所需”？

最新評論

IT之家

熱門推薦

曝榮耀400將推國內特供版配備金屬中框配置也升級

國內監控攝像頭第一季度銷量如何小米成電商霸主銷量、銷額雙第一！

史上首次千億級家電巨頭戰略合作海信美的如何“各取所需”？