基于ViT-CNN混合網(wǎng)絡(luò)的合成孔徑雷達(dá)圖像船舶分類
哈爾濱工程大學(xué)學(xué)報(bào)
頁(yè)數(shù): 8 2024-08-05
摘要: 為了解決視覺轉(zhuǎn)換器模型缺乏多尺度與局部特征捕獲能力,難以適應(yīng)合成孔徑雷達(dá)圖像船舶分類任務(wù)的問題,本文提出一種混合網(wǎng)絡(luò)模型用于合成孔徑雷達(dá)圖像船舶分類。利用分階段下采樣網(wǎng)絡(luò)結(jié)構(gòu),解決了ViT無法捕獲多尺度特征的問題。通過在ViT模型的3個(gè)核心模塊中融入卷積結(jié)構(gòu),設(shè)計(jì)了卷積標(biāo)記嵌入、卷積參數(shù)共享注意力和局部前饋網(wǎng)絡(luò)3個(gè)模塊,使得網(wǎng)絡(luò)能夠同時(shí)捕獲船舶圖像的全局和局部特征,進(jìn)一步增強(qiáng)了...