大公產品

首页 > 新闻 > 正文

昇騰聯動鯤鵬 打造超級「AI服務器」

時間:2025-06-21 05:02:20來源:大公报

  圖:華為盤古大模型5.5發布現場。/大公報記者毛麗娟攝

  【大公報訊】記者毛麗娟深圳報道:在6月20日下午舉行的華為開發者大會2025(HDC 2025)上,華為常務董事、華為雲計算CEO張平安宣布基於CloudMatrix 384超節點的新一代昇騰AI雲服務全面上線,為大模型應用提供澎湃算力;宣布盤古大模型5.5正式發布。張平安表示,盤古大模型基於昇騰雲的全棧軟硬件訓練而成的,這標誌着基於昇騰架構可以打造出世界一流大模型。

  新一代昇騰AI雲 算力增50%

  華為雲新一代昇騰AI雲服務基於CloudMatrix 384超節點,首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一台超級「AI服務器」,單卡推理吞吐量躍升到2300 Tokens/s(每秒處理令牌數),同時,超節點還可以支持「一卡一算力任務」,將算力有效使用率(MFU)提升50%以上。

  盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回覆,複雜問題深度思考,整體模型推理效率提升8倍。

最新要聞

最受歡迎