圖:一款AI雙目直播相機吸引了採訪團關注,不少成員試用體驗。/大公文匯全媒體記者王凱輝攝
27日,2025全球華文媒體高層湖南行採訪團來到馬欄山音視頻實驗室,一探「湘軍」音視頻技術突圍背後的奧秘。
在實驗室展廳,一款AI雙目直播相機吸引了採訪團,隨着工作人員手勢的變化,直播鏡頭推進拉遠。而做出「噓」的手勢就能實現AI音頻降噪,在有風等噪音狀態下也能保持安靜環境。一系列實用功能解決了用戶不少煩惱,媒體代表紛紛試用體驗,並上前詢問:「還有多久可以市場化」「這款產品多少錢」……工作人員回應,目前該產品還在研發階段,有望10月量產上市。
解決「卡脖子」 音視頻技術自主可控
另一款多語種的《哪吒.魔童鬧海》電子屏前也圍滿了人,火爆全球的電影被AI視頻翻譯工具翻譯成多國語言版本,英語、阿拉伯語、西班牙語……一些高燃台詞被翻譯後別有韻味,來自世界各地的華文傳媒成員紛紛稱讚這一前沿技術。工作人員介紹,「這項新技術能從聲音上復刻演員的音色,在特定文化語境下的表達也能達到極高準確率。」這項技術的應用將有利於文化出海,講好中國故事。
據了解,實驗室所有產品都堅持基於國產芯片開發,真正實現音視頻技術的自主可控。馬欄山音視頻實驗室主任塗永峰表示,音視頻實驗室從AI賦能音視頻內容、音視頻專業測試等領域推動技術創新,構建起音視頻國產化、平民化、底座化強勁支撐。
讓採訪團印象深刻的是「音視頻平民化」,普通人也可享受如杜比音效等高端音視頻技術。塗永峰說,「一些音視頻技術體驗門檻很高,我們一直在努力通過研發與普及,讓先進的媒體技術進入到千家萬戶。」
塗永峰表示,實驗室的核心使命就是攻克音視頻領域的「卡脖子」技術,打造自主可控的關鍵技術鏈,並推動這些技術在媒體、文創等領域的廣泛應用。據統計,馬欄山音視頻實驗室已有7項技術成果實現產業化,衍生出3家科技企業,預計年內技術合同成交額將突破億元。\大公文匯全媒體記者王凱輝