DeepSeek創始人梁文鋒論文登《自然》封面明確否認使用OpenAI模型輸出訓練

時間：2025-09-19 05:02:44來源：大公报

　　【大公報訊】據中通社報道：由DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文，近日榮登國際權威期刊《自然（Nature）》封面。這是全球首個經過同行評審的主流大語言模型，填補了業內空白。

　　綜合媒體18日消息，《自然》評價指：「目前幾乎所有主流大模型尚未經過獨立同行評審，這一空白終於被DeepSeek打破。」相較今年1月發布的初版論文，新論文披露了更多模型訓練細節，並正面回應了模型發布初期的質疑。

　　使用的數據全部來自互聯網

　　在同行評議過程中，DeepSeek團隊根據評審意見減少了對模型的擬人化描述，並增加了模型訓練的技術細節說明，包括模型訓練數據類型和安全性考慮等，並回應了此前關於知識蒸餾的質疑。

　　DeepSeek明確否認了此前關於其使用OpenAI模型輸出進行訓練的質疑。在長達64頁的同行評審文件中，DeepSeek介紹，DeepSeek-V3 Base（DeepSeek-R1的基座模型）使用的數據全部來自互聯網，雖然可能包含GPT-4生成的結果，但絕非有意而為之，更沒有專門的蒸餾環節。



大公產品

DeepSeek創始人梁文鋒論文登《自然》封面明確否認使用OpenAI模型輸出訓練

時間：2025-09-19 05:02:44來源：大公报

最新要聞

最受歡迎



大公產品

﻿DeepSeek創始人梁文鋒論文登《自然》封面 明確否認使用OpenAI模型輸出訓練

時間：2025-09-19 05:02:44來源：大公报

最新要聞

最受歡迎

DeepSeek創始人梁文鋒論文登《自然》封面明確否認使用OpenAI模型輸出訓練