【大公報訊】綜合新華網思客、灣區財經傳媒報道:24日深夜,中國人工智能初創公司深度求索(DeepSeek)低調上線了DeepSeek-V3的新版本DeepSeek-V3-0324,參數量為6850億,在代碼、數學、推理等多個方面的能力再次顯著提升,代碼能力追平美國Anthropic公司大模型Claude 3.7。與V3相同,V3-0324模型採用混合專家(MoE)架構,並開源允許自由商用。
有用戶在實測中發現,V3-0324能一次性生成800行無錯誤的網頁代碼,並實現動態響應式布局和交互效果,且在數學與邏輯推理方面能力增強,在經典的「4升水壺問題」和數學競賽題中,部分表現接近專業推理模型;在模型架構與開源生態方面,V3-0324採用MIT許可證,允許自由修改、分發及商業化應用,進一步降低了開發者的使用門檻。
有AI研究者指出,V3-0324模型在所有基準測試中都取得巨大進步,可能已超越美國Anthropic公司的Claude 3.5 Sonnet,成為最強大的非推理模型。據悉,Claude 3.5 Sonnet是當前最受認可的商業AI模型之一。此外,V3-0324模型可直接在消費級硬件上運行,而不需要動輒千瓦級別功耗的數據中心,這意味着V3-0324模型的部署和運營門檻已大大降低。
寶馬攜手阿里開發AI應用
26日,寶馬集團宣布與阿里巴巴集團深化戰略合作,基於阿里通義AI大模型,聯合開發AI引擎,應用於中國市場的寶馬新世代系列車型。阿里巴巴集團CEO吳泳銘表示,此次合作主要聚焦在AI大模型、智能語音交互等前沿技術領域,將助力寶馬打造更智能的AI體驗,這是推動AI與先進製造業融合的創新探索。基於通義大模型和斑馬元神AI,全新BMW智能個人助理採用寶馬與阿里共同開發的AI引擎,計劃搭載於中國生產的BMW新世代系列車型上,預計2026年在中國市場交付。