語(yǔ)音深度偽造及其檢測(cè)技術(shù)研究進(jìn)展
中國(guó)圖象圖形學(xué)報(bào)
頁(yè)數(shù): 33 2024-08-15
摘要: 語(yǔ)音深度偽造技術(shù)是利用深度學(xué)習(xí)方法進(jìn)行合成或生成語(yǔ)音的技術(shù)。人工智能生成內(nèi)容技術(shù)的快速迭代與優(yōu)化,推動(dòng)了語(yǔ)音深度偽造技術(shù)在偽造語(yǔ)音的自然度、逼真度和多樣性等方面取得顯著提升,同時(shí)也使得語(yǔ)音深度偽造檢測(cè)技術(shù)面臨著巨大挑戰(zhàn)。本文對(duì)語(yǔ)音深度偽造及其檢測(cè)技術(shù)的研究進(jìn)展進(jìn)行全面梳理回顧。首先,介紹以語(yǔ)音合成(speech synthesis,SS)和語(yǔ)音轉(zhuǎn)換(voice conversi...