關于ZAKER 合作
      IT之家 19分鐘前

      Meta 開源 LlamaFirewall 防護工具,助力構建安全 AI 智能體

      IT 之家 5 月 9 日消息,Meta AI 公司最新推出 LlamaFirewall,應對 AI 智能體不斷演變的威脅格局,為生產環境中的 AI 智能體提供系統級安全保護。

      隨著大型語言模型(LLMs)嵌入 AI 智能體并被廣泛應用于高權限場景,安全隱患隨之增加。這些智能體可以讀取郵件、生成代碼、調用 API,一旦被惡意利用,后果不堪設想。

      傳統的安全機制,如聊天機器人內容審核或硬編碼模型限制,已無法滿足具備廣泛能力的 AI 智能體需求。Meta AI 針對提示注入攻擊、智能體行為與用戶目標不一致、以及不安全的代碼生成三大核心挑戰,開發了 LlamaFirewall。

      IT 之家援引博文介紹,LlamaFirewall 采用分層框架,包含三個專門的防護模塊:

      PromptGuard 2 是一個基于 BERT 架構的分類器,能實時檢測越獄行為和提示注入,支持多語言輸入,其 86M 參數模型性能強勁,22M 輕量版本則適合低延遲部署。

      AlignmentCheck 是一種實驗性審計工具,通過分析智能體內部推理軌跡,確保行為與用戶目標一致,特別擅長檢測間接提示注入。

      CodeShield 則是一個靜態分析引擎,檢查 LLM 生成代碼中的不安全模式,支持多種編程語言,能在代碼提交或執行前捕獲 SQL 注入等常見漏洞。

      Meta 在 AgentDojo 基準測試中評估了 LlamaFirewall,模擬了 97 個任務領域的提示注入攻擊。

      結果顯示,PromptGuard 2(86M)將攻擊成功率(ASR)從 17.6% 降至 7.5%,任務實用性損失極小;AlignmentCheck 進一步將 ASR 降至 2.9%;整體系統將 ASR 降低 90% 至 1.75%,實用性略降至 42.7%。CodeShield 在不安全代碼數據集上也表現出色,精準度達 96%,召回率(recall) 79%,響應時間適合生產環境實時使用。

      相關標簽
      IT之家

      IT之家

      數碼,科技,生活

      訂閱

      覺得文章不錯,微信掃描分享好友

      掃碼分享

      熱門推薦

      查看更多內容
      主站蜘蛛池模板: 91一区二区三区四区五区| 色一情一乱一伦一区二区三欧美| 无码精品人妻一区| 国产成人久久一区二区三区 | 亚欧在线精品免费观看一区| 无码乱码av天堂一区二区| 亚洲av无码一区二区三区人妖| 亚洲一区二区三区AV无码| 国产亚洲一区二区三区在线不卡| 在线观看国产一区| 精品国产一区二区三区免费看| 东京热人妻无码一区二区av| 免费高清av一区二区三区| 亚洲综合无码一区二区三区| 内射少妇一区27P| 精品国产乱码一区二区三区| 久久国产午夜精品一区二区三区| 欧洲亚洲综合一区二区三区| 无码人妻精品一区二区三区99性| 一区二区在线免费观看| 国产一区二区三区不卡AV| 亚洲色欲一区二区三区在线观看| 国产激情精品一区二区三区| 国产成人久久精品麻豆一区| 国产伦精品一区二区三区精品| 福利一区福利二区| 国产在线精品一区二区中文| 性无码一区二区三区在线观看| 国产剧情国产精品一区| 亚洲中文字幕一区精品自拍| 无码一区二区三区在线| 国产凸凹视频一区二区| 亚洲国产综合无码一区| 亚洲一区电影在线观看| 成人丝袜激情一区二区| 国模精品一区二区三区| 国产精品免费一区二区三区四区| 日韩精品区一区二区三VR| 国产成人精品日本亚洲专一区 | 国产成人精品一区二区三区免费 | 日本一区免费电影|