語音深度偽造及其檢測(cè)技術(shù)研究進(jìn)展
中國圖象圖形學(xué)報(bào)
頁數(shù): 33 2024-08-15
摘要: 語音深度偽造技術(shù)是利用深度學(xué)習(xí)方法進(jìn)行合成或生成語音的技術(shù)。人工智能生成內(nèi)容技術(shù)的快速迭代與優(yōu)化,推動(dòng)了語音深度偽造技術(shù)在偽造語音的自然度、逼真度和多樣性等方面取得顯著提升,同時(shí)也使得語音深度偽造檢測(cè)技術(shù)面臨著巨大挑戰(zhàn)。本文對(duì)語音深度偽造及其檢測(cè)技術(shù)的研究進(jìn)展進(jìn)行全面梳理回顧。首先,介紹以語音合成(speech synthesis,SS)和語音轉(zhuǎn)換(voice conversi...