申威26010眾核處理器上Winograd卷積算法的研究與優(yōu)化
計算機研究與發(fā)展
頁數(shù): 18 2023-07-20
摘要: 卷積作為深度學(xué)習(xí)中被頻繁使用的關(guān)鍵部分,其并行算法的研究已成為高性能計算領(lǐng)域中的熱門話題.隨著我國自主研發(fā)的申威26010眾核處理器在人工智能領(lǐng)域的快速發(fā)展,對面向該處理器的高性能并行卷積算法提出了迫切的需求.針對申威26010處理器的架構(gòu)特征以及Winograd卷積算法的計算特性,提出了一種高性能并行卷積算法——融合Winograd卷積算法.該算法不同于依賴官方GEMM(ge...