大公產品

首页 > 新闻 > 正文

OpenAI再推開源模型 被諷「無效更新」

時間:2025-08-07 05:02:15來源:大公报

  圖:Meta創辦人朱克伯格(左)和妻子普莉希拉.陳。\路透社

  當地時間8月5日,OpenAI宣布推出兩款全新開源模型。這是自2019年發布GPT-2以來,OpenAI再次釋出開源模型。外界認為,近年來中國AI公司如DeepSeek、阿里巴巴等在開放AI領域發展迅猛,Meta近期又以重金挖走多位OpenAI研究人員,再加上新一代模型GPT-5遲遲未能面世,面對各方種種壓力,OpenAI不得不被迫轉型。公司CEO阿爾特曼早前坦言,在是否開源的問題上,OpenAI站在了「歷史錯誤的一邊」。

  【大公報訊】OpenAI於8月5日推出兩款開源模型,GPT-oss-120b和GPT-oss-20b,可在開源技術平台Hugging Face上免費下載。這也是OpenAI自2019年發布GPT-2以來,時隔6年再次釋出開源模型。

  不過,由於新模型在性能上未有質的飛躍,此次釋出的兩個開源模型也被網友戲稱是「擠牙膏式無效更新」。

  「AI幻覺」多 未公開訓練數據

  根據科技媒體TechCrunch披露的技術數據,在多項測試中,GPT-oss-120b和GPT-oss-20b的表現均遜於OpenAI的o3和o4-mini模型。

  此外,這兩款新模型回答問題時出現「AI幻覺」的比例分別高達49%和53%,是o1模型(16%)的三倍多,也高於o4-mini模型(36%)。

  雖然OpenAI並未透露用於訓練新模型的數據,因此還未能達到完全「開源」的標準,但其自2022年發布聊天機器人ChatGPT並引發AI熱潮以來,便對自家技術嚴格保密,此次發布開源模型可以說是一次巨大轉變。

  當被問及「為什麼突然又開源」時,OpenAI稱是為了「加速前沿研究,促進創新,並推動在廣泛應用場景下實現更安全、更透明的AI開發」。

  但外界認為,種種壓力之下,OpenAI不得不作出改變。

  中國開源模型的爆發式發展很難不觸動OpenAI以及硅谷的神經。今年年初,中國AI初創公司深度求索(DeepSeek)釋出震撼硅谷的開源模型R1,此後大批中國模型走上開源之路。

  以阿里巴巴集團開發的AI模型Qwen為例,Qwen2.5去年在Hugging Face上的下載量甚至超過美科企巨頭Meta旗下的Llama系列,成為全球下載量最多的開源模型。

  在美國國內,自6月以來,Meta創辦人朱克伯格對OpenAI展開大規模挖角,迄今已聘用其中至少10人,加入自家AI研發團隊「超級智能實驗室」。

  中國開源AI領跑 美業界難追

  除外部壓力,OpenAI自身也面臨困境,其最新模型GPT-5已「難產」數月。為緩解外界焦慮,OpenAI只得一次次釋出新產品。

  分析指出,全球科企在AI方面的競爭已趨白熱化,美國公司在開源模型方面已落後於中國同業。

  全球知名AI基準測試機構Artificial Analysis發現,在排名前15的AI模型中,僅有5個為開源,且全部來自中國的AI公司。

  隨着開源AI浪潮席捲全球,業界預估,到2030年,先進AI模型的平均開發成本預計下降40%,令更多小企業能夠負擔得起。

  8月4日,美國業界正式啟動了一項名為「美國真正開源模型」(ATOM)的新計劃,擬集中資源開發強大的AI開源模型。但有評論指出,這項計劃雖然雄心勃勃,但仍存在人才缺失、協調不足和成本高昂等問題。

  (綜合報道)

最新要聞

最受歡迎