大公產品

首页 > 新闻 > 正文

一步到位/國產視頻大模型 直接生成16秒短片

時間:2024-04-28 04:03:40來源:大公报

  圖:掃一掃有片睇

  今年初,文生視頻大模型Sora在全球人工智能業內外引發廣泛關注。27日,2024中關村論壇年會上首次發布中國自研的具「長時長、高一致性、高動態性」特點的文生視頻大模型Vidu。這一視頻大模型由清華大學聯合北京生數科技有限公司共同研發,可根據文本描述直接生成長達16秒、分辨率高達1080P的高清視頻內容,不僅能模擬真實物理世界,還擁有豐富想像力。

  清華大學人工智能研究院副院長、生數科技首席科學家朱軍說,當前內地視頻大模型的生成視頻時長大多為4秒左右,Vidu則可實現一次性生成16秒的視頻時長。同時,視頻畫面能保持連貫流暢,隨着鏡頭移動,人物和場景在時間、空間中能保持高一致性。

  「Vidu能模擬真實物理世界,生成細節複雜且符合物理規律的場景,還能創造出具有深度和複雜性的超現實主義內容。」朱軍介紹,由於採用「一步到位」的生成方式,視頻片段從頭到尾連續生成,沒有明顯的插幀現象,「我們相信,Vidu未來能支持生成更加多樣化、更長時長的視頻內容,探索不同的生成任務,其靈活架構也將兼容更廣泛的模態,進一步拓展多模態通用能力的邊界。」\新華社

最新要聞

最受歡迎