面向眾核CPU的稠密線性求解器性能評(píng)測(cè)與優(yōu)化
計(jì)算機(jī)工程與科學(xué)
頁(yè)數(shù): 9 2024-06-15
摘要: 稠密線性求解器在高性能計(jì)算和機(jī)器學(xué)習(xí)等領(lǐng)域扮演著重要的角色。其典型的并行算法實(shí)現(xiàn)通常構(gòu)建在著名的fork-join或task-based編程模型之上。盡管采用fork-join模型的主流稠密線性代數(shù)庫(kù)能將大部分的計(jì)算轉(zhuǎn)移到高度優(yōu)化、高性能的BLAS 3例程上,由于fork-join不靈活的執(zhí)行流,它們?nèi)匀晃茨芨咝У乩帽姾薈PU的計(jì)算資源。采用task-based編程模型的開源... (共9頁(yè))