大公產品

首页 > 新闻 > 正文

DeepSeek大模型上新 關聯下代中國芯

時間:2025-08-22 05:02:31來源:大公报

  【大公報訊】據中通社報道:中國人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大語言模型DeepSeek-V3.1正式發布。

  據DeepSeek介紹,新升級版本變化體現在三方面:混合推理架構、更高的思考效率、更強的Agent(智能體)能力。通過「深度思考」按鈕切換,DeepSeek-V3.1實現一個模型同時支持兩種模式:面對簡單問題時,能以「非思考模式」快速回答。處理複雜問題時,可切換到「思考模式」,給出更具深度和邏輯的解答。此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。DeepSeek官方公眾號在其文章置頂留言裏說,UE8M0 FP8是針對即將發布的下一代中國產芯片設計。

  官方數據顯示,與今年5月發布的旗艦推理模型DeepSeek R1升級版本「R1-0528」相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短時間給出答案,token(大模型文本處理的最小單位)消耗量可減少20%至50%,各項任務平均表現與R1-0528持平。

最新要聞

最受歡迎