

新聞客戶端| LED屏



大公產品

首页 > 新闻 > 正文

DeepSeek檔案

時間：2025-02-16 05:02:27來源：大公报

　　人才

　　團隊成員不超過140人、平均年齡不到30歲，成員多是來自清華、北大、北航等頂尖高校的應屆博士畢業生、在讀生以及碩士生。

　　技術

　　高性能，主要來自混合專家模型（MoE）、多標記預測（MTP）和多頭潛在注意力機制（MLA）等多項技術創新。

　　成果

　　今年1月10日推出的DeepSeek-R1模型聊天機器人程式，於1月27日超過ChatGPT成為美區iOS應用商店免費應用程式榜首。

　　合作

　　微軟、英偉達、亞馬遜等多家科技巨擘已接入DeepSeek-R1模型。

　　研發

　　DeepSeek-V3模型的訓練成本為557.6萬美元，性能比肩世界頂級大模型。

　　大公報整理

最新要聞

民企合法權益切實依法保護

專家：粵港澳遊艇互認攜手吸引外國客

專家解讀/中俄雙邊合作從「量」向「質」昇華

北京觀察/高舉「反霸」旗幟共創美好未來\馬浩亮

函賀紀念中國抗日戰爭和蘇聯衛國戰爭勝利80周年中俄人文交流活動習近平：中俄加強人文交流促進人民相知相親

1900年以來秘密會議花費時間

新教皇面對內外挑戰

萌寵集/孔雀求醫\佑松

最受歡迎

關於大公網| 法律聲明| 廣告政策| 聯絡我們|
承印商名稱：大公報（香港）有限公司地址：香港香港仔田灣海旁道7號興偉中心3樓