每日快報!西交大開源SadTalker模型 圖片+音頻秒變視頻!

來源:DoNews快訊


【資料圖】

西安交通大學的研究人員提出了SadTalker模型,通過從音頻中學習生成3D運動系數(shù),使用全新的3D面部渲染器來生成頭部運動,可以實現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。為了實現(xiàn)音頻驅(qū)動的真實頭像視頻生成,研究人員將3DMM的運動系數(shù)視為中間表征,并將任務分為兩個主要部分,旨在從音頻中生成更真實的運動系數(shù),并單獨學習每個運動以減少不確定性。該技術可以應用于數(shù)?(站長之家)

標簽:

推薦

財富更多》

動態(tài)更多》

熱點