申威1621處理器上矩陣乘法優(yōu)化研究
軟件學(xué)報(bào)
頁(yè)數(shù): 13 2022-12-01
摘要: 稠密矩陣乘法(GEMM)是很多科學(xué)與工程計(jì)算應(yīng)用中大量使用的函數(shù),也是很多代數(shù)函數(shù)庫(kù)中的基礎(chǔ)函數(shù),其性能高低對(duì)整個(gè)應(yīng)用往往有決定性的影響.另外,因其計(jì)算密集的特點(diǎn),矩陣乘法效率往往也是體現(xiàn)硬件平臺(tái)性能的重要指標(biāo).針對(duì)國(guó)產(chǎn)申威1621處理器,對(duì)稠密矩陣乘法進(jìn)行了系統(tǒng)性地優(yōu)化.基于對(duì)各部分開(kāi)銷(xiāo)的分析,以及對(duì)體系結(jié)構(gòu)特點(diǎn)與指令集的充分利用,對(duì)DGEMM函數(shù)從循環(huán)與分塊方案,打包方式,...