【太平洋科技快訊】近日,阿里巴巴在 GitHub 開源了 ZeroSearch 大模型搜索引擎。該引擎基于強化學習框架,使大模型無需依賴真實搜索引擎即可具備搜索能力。
據悉,ZeroSearch 利用了大型語言模型在預訓練過程中積累的海量知識,將其轉化為強大的檢索模塊。與傳統的搜索引擎不同,ZeroSearch 無需與真實的搜索引擎進行交互,而是通過一種獨特的強化學習框架,直接利用大模型自身的能力進行信息檢索。這一設計使得 ZeroSearch 能夠獨立于現有搜索引擎生態系統運行,為信息檢索領域帶來了全新的可能性。
為了驗證 ZeroSearch 的性能,研究人員在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大問答數據集上進行了綜合評測。結果顯示,一個 70 億參數的監督微調模型在使用 ZeroSearch 后,其搜索能力評分達到了 33.06; 而 140 億參數的模型更是達到了 33.97,成功超越了谷歌搜索的 32.47。