由 DeepSeek 團隊共同完成、梁文鋒擔任通訊作者的 DeepSeek-R1 推理模型研究論文,登上了國際權威期刊《自然(Nature)》的封面。與今年 1 月發布的 DeepSeek-R1 的初版論文相比,本次論文披露了更多模型訓練的細節,并正面回應了模型發布之初的蒸餾質疑。DeepSeek-R1 也是全球首個經過同行評審的主流大語言模型。Nature 評價道:目前幾乎所有主流的大模型都還沒有經過獨立同行評審,這一空白 " 終于被 DeepSeek 打破 "。(第一財經)
36氪
9分鐘前