基于Mel頻譜值和深度學(xué)習(xí)網(wǎng)絡(luò)的鳥聲識別算法
應(yīng)用聲學(xué)
頁數(shù): 8 2023-05-26
摘要: 為了增強(qiáng)網(wǎng)絡(luò)對鳥鳴聲信號的特征學(xué)習(xí)能力并提高識別精度,提出一種基于深度殘差收縮網(wǎng)絡(luò)和擴(kuò)張卷積的鳥聲識別方法。首先,提取鳥鳴聲信號的對數(shù)Mel特征及其一階和二階差分系數(shù)組成log-Mel特征集,作為網(wǎng)絡(luò)模型的輸入;其次,通過深度殘差收縮網(wǎng)絡(luò)自動學(xué)習(xí)噪聲閾值,減少噪聲干擾;然后,引入擴(kuò)張卷積增大卷積核感受野并利用注意力機(jī)制使網(wǎng)絡(luò)聚焦于關(guān)鍵幀特征;最后,通過雙向長短時(shí)記憶網(wǎng)絡(luò)從學(xué)到的...