多模態(tài)數(shù)字人建模、合成與驅(qū)動綜述
中國圖象圖形學(xué)報
頁數(shù): 19 2024-09-16
摘要: 多模態(tài)數(shù)字人是指具備多模態(tài)認知與交互能力,且有類人的思維和行為邏輯的真實自然虛擬人。近年來隨著計算機視覺與自然語言處理等領(lǐng)域的交叉融合以及蓬勃發(fā)展,相關(guān)技術(shù)取得顯著進步。本文討論在圖形學(xué)和視覺領(lǐng)域比較重要的多模態(tài)人頭動畫、多模態(tài)人體動畫以及多模態(tài)數(shù)字人形象構(gòu)建3個主題,介紹其方法論和代表工作。在多模態(tài)人頭動畫主題下介紹語音驅(qū)動人頭和表情驅(qū)動人頭兩個問題的相關(guān)工作。在多模態(tài)人體動... (共19頁)