基于鯤鵬和昇騰異構(gòu)平臺的單節(jié)點HPL-AI設(shè)計與優(yōu)化
華南理工大學(xué)學(xué)報(自然科學(xué)版)
頁數(shù): 10 2024-02-15
摘要: 鑒于低精度浮點運算擁有更快的運算速度,越來越多的高性能應(yīng)用采用混合精度方案進行加速,而同樣采用該方案來加速的AI(人工智能)大模型也受到廣泛關(guān)注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基準(zhǔn)測試被提出,用于評估高性能系統(tǒng)的混合精度運算性能。針對該基準(zhǔn)測試,本研究在鯤鵬和昇騰異構(gòu)平臺上設(shè)計并...