當前位置:首頁 > 科技文檔 > 硬件 > 正文

面向眾核CPU的稠密線性求解器性能評測與優(yōu)化

計算機工程與科學 頁數(shù): 9 2024-06-15
摘要: 稠密線性求解器在高性能計算和機器學習等領域扮演著重要的角色。其典型的并行算法實現(xiàn)通常構建在著名的fork-join或task-based編程模型之上。盡管采用fork-join模型的主流稠密線性代數(shù)庫能將大部分的計算轉移到高度優(yōu)化、高性能的BLAS 3例程上,由于fork-join不靈活的執(zhí)行流,它們仍然未能高效地利用眾核CPU的計算資源。采用task-based編程模型的開源...

開通會員,享受整站包年服務立即開通 >