針對口音識別中冗余特征及長尾效應(yīng)的有效方法
應(yīng)用聲學(xué)
頁數(shù): 7 2024-02-27
摘要: 口音識別是指在同一語種下識別不同的區(qū)域口音的過程。為了提高口音識別的準(zhǔn)確率,采用了多種方法,取得了明顯的效果。首先,為了解決聲學(xué)特征中關(guān)鍵特征權(quán)重不突出的問題,引入了有效的注意力機制,并對多種注意力機制進(jìn)行了比較和分析。通過模型自適應(yīng)學(xué)習(xí)通道和空間維度的不同權(quán)重,提高了口音識別的性能。在Common Voice英語口音數(shù)據(jù)集上的實驗結(jié)果表明,引入CBAM注意力模塊是有效的,識別...