圖:去年底在上海舉辦的百度世界2024活動上,百度首席技術官王海峰公布文心一言用戶規模達4.3億。
文心大模型兩周年之際,百度於16日正式發布文心大模型4.5和文心大模型X1。其中,文心大模型4.5是百度旗下首個原生多模態大模型,其多模態理解、文本和邏輯推理能力顯著提升,在多項測試中表現優於GPT4.5,API調用價格僅為GPT4.5的1%。文心大模型X1則為深度思考模型,性能對標DeepSeek-R1,調用價格約為R1的一半。
目前,兩款模型已在文心一言官網上線,百度搜索、文小言APP等產品也將陸續接入。此前,百度宣布文心一言將於4月1日免費,本次發布在帶來兩款全新大模型的同時,也將免費時間提前半個月。\大公報記者 郭瀚林北京報道
文心4.5能理解文圖影音 「智商」「情商」兼備
與以往不同,百度今次未召開發布會,直接宣布兩款模型在文心一言官網上線。作為百度新一代基座大模型,文心大模型4.5的多項基準測試成績優於GPT4.5、DeepSeek-V3等,並在平均分上以79.6分高於GPT4.5的79.14。據介紹,文心大模型4.5具備優秀的多模態理解能力,能對文字、圖片、音頻、視頻等內容進行綜合理解。不僅有圖形推理、圖表分析的「高智商」,還具備理解網絡梗圖、諷刺漫畫等多模態內容的「高情商」。
用戶可給文心大模型4.5發送一張圖片或者一段視頻,讓其對製作工藝進行賞析。據用戶案例展示,文心4.5可識別出一張文物圖片中的唐三彩騎駝樂舞俑,並從造型生動、釉色鮮明、工藝精湛這三個方面對文物工藝進行詳細介紹和分析。此外,用戶還可給文心4.5發送一道數學題,讓其「在線解題」,文心4.5將綜合理解圖中的文字與圖表內容,提取出題目考查的重點,並給出詳細解題步驟和細化選項分析,最終得出正確答案。
文心大模型X1則為深度思考模型,不僅在性能上對標DeepSeek-R1,具備「長思維鏈」,擅長中文知識問答、文學創作、邏輯推理等,而且增加多模態能力和多工具調用,能理解和生成圖片,還能調用工具生成代碼、圖表等豐富內容。讓文心大模型X1使用中國各朝代歷史人物典故,替換《寒窰賦》原文中的事例,它會展現出清晰的思維鏈:找到和原文相似的人物典故→注意文風和句式→檢查人物典故的適配度→行文保持結構流暢,最後生成和原文立意、文風、句式都基本一致的文本。
X1像DeepSeek一樣展現思考過程
「與DeepSeek大模型類似,用戶提問後,文心X1在給出答案前會先展現思考過程。面對旅遊規劃、編寫課件等較複雜問題時,它能夠結合聯網搜索最新信息,詳細解讀後給出全面的回覆,更符合要求且可行性更高。」一位用戶試用文心大模型X1後說。據悉,X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、百度學術檢索、商業信息查詢、加盟信息查詢、詞雲生成等多款工具,這對於大模型應用落地是一個利好。
目前,兩款模型均已在文心一言官網上線,用戶登錄即可免費體驗。同時,企業及開發者可在百度智能雲千帆大模型平台調用新模型,文心大模型4.5已同步上線,輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心大模型X1也將於近期在該平台上線,定價為輸入0.002元/千tokens,輸出0.008元/千tokens,API調用價格約為DeepSeek推理模型R1的一半。
近期,內地AI大模型廠商紛紛宣布「迭代」,訓練和推理成本逐步下降,大模型開源大勢所趨。「從DeepSeek身上,我們學到了一件事,那就是開源最佳模型能大大促進人們使用或採納這個模型。」2月18日晚,在百度2024年第四季度及全年財報電話會上,百度創始人李彥宏如是說。