【太平洋科技快訊】5 月 9 日,騰訊混元正式推出并開源一款全新的多模態(tài)定制化視頻生成工具—— Hunyuan Custom,該工具基于混元視頻生成大模型 ( Hunyuan Video ) 打造。
此外,Hunyuan Custom 提供了多種視頻生成模式,包括單主體視頻生成、多主體視頻生成、單主體視頻配音以及視頻局部編輯等。其中,單主體生成能力已經(jīng)開源并在混元官網(wǎng)上線,用戶可以在 " 模型廣場 - 圖生視頻 - 參考生視頻 " 中體驗(yàn),其他能力也將于 5 月內(nèi)陸續(xù)開源。
對(duì)于傳統(tǒng)視頻生成模型在人物一致性和場景變換方面的限制。Hunyuan Custom 在單主體生成模式下,用戶只需上傳一張目標(biāo)人物或物體的圖片,并提供一句文本描述,例如 " 他正在遛狗 ",Hunyuan Custom 就能識(shí)別出圖片中的身份信息,并在完全不同的動(dòng)作、服飾與場景中生成連貫自然的視頻內(nèi)容。同時(shí),該工具還能實(shí)現(xiàn)多主體視頻的生成,讓多個(gè)主體按要求出現(xiàn)在視頻里。
Hunyuan Custom 具備強(qiáng)大的擴(kuò)展能力。在音頻驅(qū)動(dòng)模式下,用戶可以上傳人物圖像并配上音頻語音,模型便可生成人物在任意場景中說話、唱歌或進(jìn)行其他音視頻同步表演的效果,廣泛適用于數(shù)字人直播、虛擬客服、教育演示等場景。在視頻驅(qū)動(dòng)模式下,Hunyuan Custom 支持將圖片中的人物或物體自然地替換或插入到任意視頻片段中,進(jìn)行創(chuàng)意植入或場景擴(kuò)展,輕松實(shí)現(xiàn)視頻重構(gòu)與內(nèi)容增強(qiáng)。