OpenAI再推開源模型被諷「無效更新」

時間：2025-08-07 05:02:15來源：大公报

　　圖：Meta創辦人朱克伯格（左）和妻子普莉希拉．陳。\路透社

　　當地時間8月5日，OpenAI宣布推出兩款全新開源模型。這是自2019年發布GPT-2以來，OpenAI再次釋出開源模型。外界認為，近年來中國AI公司如DeepSeek、阿里巴巴等在開放AI領域發展迅猛，Meta近期又以重金挖走多位OpenAI研究人員，再加上新一代模型GPT-5遲遲未能面世，面對各方種種壓力，OpenAI不得不被迫轉型。公司CEO阿爾特曼早前坦言，在是否開源的問題上，OpenAI站在了「歷史錯誤的一邊」。

　　【大公報訊】OpenAI於8月5日推出兩款開源模型，GPT-oss-120b和GPT-oss-20b，可在開源技術平台Hugging Face上免費下載。這也是OpenAI自2019年發布GPT-2以來，時隔6年再次釋出開源模型。

　　不過，由於新模型在性能上未有質的飛躍，此次釋出的兩個開源模型也被網友戲稱是「擠牙膏式無效更新」。

　　「AI幻覺」多未公開訓練數據

　　根據科技媒體TechCrunch披露的技術數據，在多項測試中，GPT-oss-120b和GPT-oss-20b的表現均遜於OpenAI的o3和o4-mini模型。

　　此外，這兩款新模型回答問題時出現「AI幻覺」的比例分別高達49%和53%，是o1模型（16%）的三倍多，也高於o4-mini模型（36%）。

　　雖然OpenAI並未透露用於訓練新模型的數據，因此還未能達到完全「開源」的標準，但其自2022年發布聊天機器人ChatGPT並引發AI熱潮以來，便對自家技術嚴格保密，此次發布開源模型可以說是一次巨大轉變。

　　當被問及「為什麼突然又開源」時，OpenAI稱是為了「加速前沿研究，促進創新，並推動在廣泛應用場景下實現更安全、更透明的AI開發」。

　　但外界認為，種種壓力之下，OpenAI不得不作出改變。

　　中國開源模型的爆發式發展很難不觸動OpenAI以及硅谷的神經。今年年初，中國AI初創公司深度求索（DeepSeek）釋出震撼硅谷的開源模型R1，此後大批中國模型走上開源之路。

　　以阿里巴巴集團開發的AI模型Qwen為例，Qwen2.5去年在Hugging Face上的下載量甚至超過美科企巨頭Meta旗下的Llama系列，成為全球下載量最多的開源模型。

　　在美國國內，自6月以來，Meta創辦人朱克伯格對OpenAI展開大規模挖角，迄今已聘用其中至少10人，加入自家AI研發團隊「超級智能實驗室」。

　　中國開源AI領跑美業界難追

　　除外部壓力，OpenAI自身也面臨困境，其最新模型GPT-5已「難產」數月。為緩解外界焦慮，OpenAI只得一次次釋出新產品。

　　分析指出，全球科企在AI方面的競爭已趨白熱化，美國公司在開源模型方面已落後於中國同業。

　　全球知名AI基準測試機構Artificial Analysis發現，在排名前15的AI模型中，僅有5個為開源，且全部來自中國的AI公司。

　　隨着開源AI浪潮席捲全球，業界預估，到2030年，先進AI模型的平均開發成本預計下降40%，令更多小企業能夠負擔得起。

　　8月4日，美國業界正式啟動了一項名為「美國真正開源模型」（ATOM）的新計劃，擬集中資源開發強大的AI開源模型。但有評論指出，這項計劃雖然雄心勃勃，但仍存在人才缺失、協調不足和成本高昂等問題。

　　（綜合報道）



大公產品

OpenAI再推開源模型被諷「無效更新」

時間：2025-08-07 05:02:15來源：大公报

最新要聞

最受歡迎



大公產品

﻿OpenAI再推開源模型 被諷「無效更新」

時間：2025-08-07 05:02:15來源：大公报

最新要聞

最受歡迎

OpenAI再推開源模型被諷「無效更新」