大點數(shù)FFT在“申威26010”上的并行優(yōu)化
浙江大學學報(工學版)
頁數(shù): 9 2023-09-21
摘要: 根據(jù)“神威·太湖之光”超級計算機所用國產(chǎn)“申威26010”處理器的架構(gòu)特點和編程規(guī)范,提出針對大點數(shù)FFT的眾核并行優(yōu)化方案.該方案源自經(jīng)典的Cooley-Tukey FFT算法,通過將一維大點數(shù)數(shù)據(jù)迭代分解為二維小規(guī)模矩陣進行并行加速.為了解決矩陣“列FFT”的讀寫、轉(zhuǎn)置和計算問題,提出“列均分-行連續(xù)”的讀寫策略,通過對數(shù)據(jù)進行合理的分配、重排、交換,結(jié)合SIMD向量化、旋...