圖:商湯有多款人工智能大模型產品在世界人工智能大會上亮相。
【大公報訊】作為內地人工智能龍頭的商湯(00020)昨於2023世界人工智能大會期間,宣布聯合香港中文大學、清華大學、復旦大學等發布升級版「書生通用大模型體系」,包括「書生.多模態」、「書生.浦語」和「書生.天際」等三大基礎模型,以及首個面向大模型研發與應用的全鏈條開源體系。
書生由商湯科技、上海人工智能實驗室、清華大學、香港中文大學、上海交通大學於2021年11月首次共同發布,並持續聯合研發。商湯表示,書生通過文本來定義任務,從而可以靈活地定義不同場景的任務需求,並根據給定視覺圖像和任務的提示性語句,給予相應的指令或作答,進而具備通用場景下的高級感知和複雜問題處理能力,例如圖像描述、視覺問答、視覺推理和文字識別等。
「書生.多模態」整合了語言、圖像、視頻等多種模態技術,實現通過自然語言定義視覺任務,並具有多模態交互和跨模態生成能力,性能達到世界領先水平。
「書生.浦語」更具備強大的綜合能力。今年三月,書生的全面評測結果便顯示,「書生.浦語」不僅在知識掌握、閱讀理解、數學推理、多語翻譯等多個測試任務上表現優秀。其在綜合性考試中更是表現突出,在多項中文考試中取得超越ChatGPT的成績。現在升級後的「書生.浦語」更成為支持8K語境長度的千億參數級語言大模型。
而「書生.天際」更是城市級NeRF實景三維大模型,具備千億參數,並已實現對100平方公里城市實景進行4K高精度建模以及編輯。
為自動駕駛提供精準感知
此外,書生目前是全球開源模型中ImageNet準確度最高、規模最大,同時也是物體檢測標杆數據集COCO中唯一超過65.0 mAP的模型,擁有30億參數,其圖文跨模態開放任務處理能力可為自動駕駛、機械人等通用場景任務提供高效精準的感知和理解能力支持。
除了發布升級版「書生通用大模型體系」外,第六屆世界人工智能大會期間,商湯更有多款人工智能大模型產品亮相。商湯董事長兼首席執行官徐立表示,大模型突破將掀起人工智能的新一輪技術革命,預計產業需求將爆炸式增長,全新的應用場景和應用模式也會迅速湧現。商湯的目標是透過「大模型+大裝置」持續提升AI基礎設施的能力。具備更強大能力的基礎模型便能融合不同領域的專業知識,構建更適合特定行業的專業大模型。