申威1621處理器上矩陣乘法優(yōu)化研究
軟件學(xué)報
頁數(shù): 13 2022-12-01
摘要: 稠密矩陣乘法(GEMM)是很多科學(xué)與工程計算應(yīng)用中大量使用的函數(shù),也是很多代數(shù)函數(shù)庫中的基礎(chǔ)函數(shù),其性能高低對整個應(yīng)用往往有決定性的影響.另外,因其計算密集的特點,矩陣乘法效率往往也是體現(xiàn)硬件平臺性能的重要指標.針對國產(chǎn)申威1621處理器,對稠密矩陣乘法進行了系統(tǒng)性地優(yōu)化.基于對各部分開銷的分析,以及對體系結(jié)構(gòu)特點與指令集的充分利用,對DGEMM函數(shù)從循環(huán)與分塊方案,打包方式,...