大公產品

首页 > 新闻 > 正文

OpenAI推GPT-5模型 新功能乏善可陳

時間:2025-08-09 05:02:17來源:大公报

  上圖:GPT-5堅稱,「blueberry」包含三個字母b。\網絡圖片;下圖:OpenAI於7日發布新模型GPT-5。\視頻截圖

  美國人工智能(AI)公司OpenAI於7日發布其最新升級版人工智能模型GPT-5,開發時間歷時逾兩年,稱其在編程、數學、寫作等方面均具備業界領先的性能。OpenAI行政總裁阿爾特曼稱,與該模型互動就像同「博士級別的專家」交談。然而,根據用戶反饋,GPT-5仍會犯低級錯誤,且糾錯能力甚至不如更早的版本。有分析指出,谷歌、Meta和中國「深度求索」(DeepSeek)等競爭對手給了OpenAI很大壓力,此時推出新模型可能只是營銷手段,而非真的有重大技術突破。

  【大公報訊】當地時間7日,OpenAI舉行1個多小時的線上發布會,正式推出GPT-5。阿爾特曼稱,這是「世界上最好的模型」,如果說GPT-3是一個高中生,GPT-4是大學生,那麼GPT-5就是「博士級別的專家」。據OpenAI介紹,GPT-5採用統一系統架構,整合了高效基礎模型、深度推理模塊和實時路由系統,能夠根據不同情況判斷何時該快速回應,何時應進行深度推理思考以提供「專家級」的答案。

  OpenAI稱,GPT-5免費向所有用戶開放。但免費用戶的提問數量有限,只有每月支付200美元的Pro訂閱用戶才能不受限地使用最新模型。

  新模型糾錯能力不如前代

  根據公開測試數據,GPT-5在編程、數學、寫作、視覺感知等領域的表現均超越前代。阿爾特曼說,用戶可通過輸入簡單的英文提示快速創建應用程式。在演示中,一名研究人員要求GPT-5創建一個用於學習法語的應用程式,該模型僅用幾分鐘就完成任務,編寫了300多行代碼。該模型還展示了快速創建遊戲和財務分析模版等功能。

  OpenAI聲稱,GPT-5在減少AI幻覺,即減少輸出不實或錯誤信息方面取得顯著進展。但在演示中,該模型解釋流體力學中的伯努利原理時仍給出了錯誤信息。一些用戶試用GPT-5後也反饋說,該模型會犯低級錯誤。一名用戶要求該模型生成一張標註各州名稱的美國地圖,但很多州的名稱拼寫錯誤,密西西比以東的州名甚至變成了亂碼。

  另外一名用戶詢問,「藍莓」(blueberry)這個單詞包含幾個字母b,該模型的回答是三個。其他用戶嘗試幫GPT-5糾正錯誤,要求其逐個檢查字母,但該模型「固執己見」,甚至試圖說服用戶接受錯誤答案。有用戶指出,去年5月問世的GPT-4o雖然也犯了同樣的錯誤,但經糾正後很快認錯。一名網友困惑地表示:「GPT-4o能接受指正,GPT-5卻試圖操縱用戶的想法。所以AI是變得越來越有敵意了嗎?」

  專家:或為營銷手段

  美媒表示,GPT-5是否真的比競爭對手更勝一籌還有待觀察。BBC記者西斯拉克說,除了一些細微的外觀差異外,該模型使用體驗與舊版聊天機器人ChatGPT類似。牛津大學AI倫理研究所的維利茲教授指出,發布GPT-5可能只是OpenAI的營銷手段,旨在維持市場熱度,以免AI開發的泡沫破裂。

  GPT-5經歷兩年多開發,由於進展不順,其問世時間多次推遲。OpenAI不得不推出GPT-4o和GPT-4.5等版本,但未能平息外界質疑。美媒指出,OpenAI雖憑藉ChatGPT系列產品一度在生成式AI領域佔據領先優勢,但目前正面臨來自競爭對手的巨大壓力。不久前,Meta也成立了AI超級智能實驗室,並從OpenAI挖走至少10名研究人員。億萬富豪馬斯克7日稱,他旗下xAI公司的最新模型Grok 4 Heavy「兩周前就超過了GPT-5」,並預告將在今年年底前推出更出色的Grok 5。

  在爭取大型企業客戶方面,OpenAI也面臨激烈競爭,許多客戶混合使用來自不同供應商的AI模型。此外,近期OpenAI與其主要投資者微軟關係緊張,雙方正圍繞未來合作進行談判。

  (綜合報道)

最新要聞

最受歡迎