
圖:最新研究發現,AI助手回答有關新聞事件的問題時,錯誤率近半。圖為英國民眾正使用手機查看資訊。\路透社
歐洲廣播聯盟(EBU)22日公布的最新研究發現,目前歐美市場上4款主流人工智能(AI)助手在回答有關新聞事件的問題時,錯誤率接近一半。這些錯誤包括援引錯誤來源、混淆新聞事實與諷刺內容,甚至憑空捏造事件。研究人員提醒民眾,現階段AI助手還不是獲取新聞的可靠渠道,同時敦促相關企業承擔相應責任予以改進。EBU稱,隨着人們越來越多地使用AI搜索新聞,公眾對新聞的信任可能因此受到損害。
【大公報訊】EBU與BBC近期展開研究,涉及來自英國、法國、德國和美國等18個國家的22家公共媒體服務機構,以14種語言對OpenAI的ChatGPT、微軟的Copilot、谷歌的Gemini及Perplexity公司的同名AI助手進行研究。這4家公司總部均位於美國。
31%回答引用錯誤信源
參與研究的專業記者根據準確性、信息來源、區分「意見」與「事實」等標準對這4款AI助手生成的3000條回答進行分析和評估。結果顯示,所有AI回答中有81%的回答存在各種形式的錯誤,其中有45%存在至少一項重大錯誤,包括憑空捏造信息等。信息溯源是AI回答錯誤的最主要原因,佔比31%,包括完全缺失信息來源、提供錯誤或誤導性的信息出處、提供的信息與來源內容不符等。
Gemini有72%的回答在信源方面存在嚴重問題,發生頻率是其他3個AI助手的兩倍以上,使其成為此次研究中表現最差的AI助手。例如,法國廣播電台詢問關於美國富豪馬斯克今年1月在美國總統特朗普的就職典禮上疑似行納粹禮的事件。Gemini在回答中將法國廣播電台的諷刺性節目「查理揭秘」作為信源,但其引用的鏈接則又指向英媒《每日電訊報》的一則視頻,且回答中的所有信息均未在這則視頻中找到。
在準確性方面,所有AI回答中有20%存在如憑空捏造事件細節、提供過時信息等問題。例如,ChatGPT在教皇方濟各去世數月後,仍稱其為現任教皇。另外,14%的回答未能向用戶提供充分的背景信息,這會使許多用戶難以理解部分專業信息。
年輕人更愛用AI搜新聞
早在今年初,BBC便對這四款AI助手進行相關研究,超過半數的回答存在援引錯誤事實或憑空捏造等重大問題。研究也發現,AI助手在總結新聞時無法區分事實與觀點。BBC生成式AI項目總監彼得.阿徹指出,在最新的研究中,這些AI助手的表現雖有所改進,但仍存在明顯缺陷。
EBU媒體總監兼副總幹事德滕德爾警告,AI助手「還不是獲取新聞的可靠方式」,如不改進,可能危及公眾對新聞的信任。「當人們不知道該相信什麼時,他們最終什麼都不相信。」
隨着AI技術不斷發展,AI助手正逐漸取代傳統搜索引擎成為用戶獲取新聞的主要渠道。據路透社新聞研究院發布的《2025年數字新聞報告》,約7%網絡新聞用戶和15%的25歲以下年輕人使用AI助手獲取新聞。
BBC最新發布的一項調查研究也顯示,許多人對AI助手的準確性抱持信任,超過三分之一的英國成年人表示相信AI能生成準確的新聞摘要。在35歲以下人群中,這一比例達到近半數。該研究警告稱,當用戶發現AI提供的新聞存在錯誤時,不僅會歸咎於AI開發者,也會問責新聞媒體,「最終這些持續存在的錯誤可能會逐漸侵蝕公眾對新聞及新聞品牌的信任根基」。
(綜合報道)