申威26010眾核處理器上Winograd卷積算法的研究與優(yōu)化
計(jì)算機(jī)研究與發(fā)展
頁(yè)數(shù): 18 2023-07-20
摘要: 卷積作為深度學(xué)習(xí)中被頻繁使用的關(guān)鍵部分,其并行算法的研究已成為高性能計(jì)算領(lǐng)域中的熱門(mén)話(huà)題.隨著我國(guó)自主研發(fā)的申威26010眾核處理器在人工智能領(lǐng)域的快速發(fā)展,對(duì)面向該處理器的高性能并行卷積算法提出了迫切的需求.針對(duì)申威26010處理器的架構(gòu)特征以及Winograd卷積算法的計(jì)算特性,提出了一種高性能并行卷積算法——融合Winograd卷積算法.該算法不同于依賴(lài)官方GEMM(ge...