【大公報訊】據中通社報道:由DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日榮登國際權威期刊《自然(Nature)》封面。這是全球首個經過同行評審的主流大語言模型,填補了業內空白。
綜合媒體18日消息,《自然》評價指:「目前幾乎所有主流大模型尚未經過獨立同行評審,這一空白終於被DeepSeek打破。」相較今年1月發布的初版論文,新論文披露了更多模型訓練細節,並正面回應了模型發布初期的質疑。
使用的數據全部來自互聯網
在同行評議過程中,DeepSeek團隊根據評審意見減少了對模型的擬人化描述,並增加了模型訓練的技術細節說明,包括模型訓練數據類型和安全性考慮等,並回應了此前關於知識蒸餾的質疑。
DeepSeek明確否認了此前關於其使用OpenAI模型輸出進行訓練的質疑。在長達64頁的同行評審文件中,DeepSeek介紹,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的數據全部來自互聯網,雖然可能包含GPT-4生成的結果,但絕非有意而為之,更沒有專門的蒸餾環節。