
圖:香港理工大學人工智能高等研究院在AI訓練技術有新突破,可大幅降本及提升效率。
香港理工大學人工智能高等研究院(PAAI)近期在AI訓練技術上突破頻現,該院執行院長楊紅霞教授率團隊,提出「協作式生成人工智能」創新模式,將過往的集中式訓練轉為分散式,開源FP8低比特訓練方案、研發InfiFusion模型融合技術,大幅降低成本提升效率。該技術目前已用於醫療靶區規劃等領域,正聯合多家醫院推動臨床落地,項目並計劃在大灣區推進商業化。\大公報記者 邱梓茵
團隊主導者楊紅霞教授,擁有字節跳動、阿里巴巴等「大廠」15年從業經驗,曾負責搭建千問團隊、豆包性格團隊,是生成式AI領域開拓者。她指出,當前大模型在高精尖領域難有進展,根源在於企業多依賴互聯網公開數據訓練,無法適應高精尖行業需要,若採用傳統的集中式AI訓練方法適應行業則耗時長,其團隊方案正解決此問題。
節省算力 料成AI發展趨勢
楊紅霞教授介紹,團隊率先開源「端到端FP8低比特訓練全套方案」,全球掌握此核心技術團隊寥寥。相較主流的BF16精度標準,FP8訓練速度快逾20%,內存佔用少逾10%,成本大降,還整合AI訓練三步驟,訓練效果媲美BF16─即GPT、DeepSeek等主流AI使用的訓練模式。團隊現正研發更省成本的FP4方法,相關論文已發表,楊紅霞教授表示,「低比特一定是AI發展未來大勢所趨」。
團隊研發的「InfiFusion模型融合技術」實現關鍵突破。僅需數百GPU小時,即可融合出傳統方法需100萬至200萬GPU小時訓練的大模型,大幅節省算力與時間成本。
楊紅霞教授解釋,傳統生成式AI需集中攝取大量原始數據訓練,而「模型融合」採用分布式路徑─以四家醫院為例,每家醫院無需共享數據,僅在本地訓練小模型,最終將四個小模型融合,即可生成涵蓋所有醫院知識與數據的全新基礎模型,過程是主動學習而非簡單整合。
她進一步以武俠小說「吸星大法」比喻「模型融合」:不同模型各有擅長,有的擅長數學解題、有的精通代碼編寫、有的強於文本理解,透過模型融合可直接吸收各模型最強能力,無需耗費大量算力重新訓練,最終實現「各項本領皆優」的AI模型。
放射治療靶區規劃省時
應用方面,團隊聚焦醫療領域。病人放射治療前的靶區規劃,醫生以往需30至50分鐘,借助其技術可降至10至20分鐘,目前正聯合復旦大學附屬華山醫院、中山大學腫瘤防治中心、山東省腫瘤醫院及香港伊利沙伯醫院推動合作與臨床落地。該技術亦能用於研究生、博士學術助手,同時作為多模態專利檢索引擎為創新研發提供高效支持。
在項目產學研規劃上,理大高級副校長(研究及創新)趙汝恆教授表示,理大目前與大灣區城市的合作已進入深度產業發展階段,該項目正在大灣區規劃後續商業化發展。