神經(jīng)網(wǎng)絡(luò)壓縮聯(lián)合優(yōu)化方法的研究綜述
智能系統(tǒng)學(xué)報
頁數(shù): 22 2024-01-03
摘要: 隨著人工智能應(yīng)用的實時性、隱私性和安全性需求增大,在邊緣計算平臺上部署高性能的神經(jīng)網(wǎng)絡(luò)成為研究熱點。由于常見的邊緣計算平臺在存儲、算力、功耗上均存在限制,因此深度神經(jīng)網(wǎng)絡(luò)的端側(cè)部署仍然是一個巨大的挑戰(zhàn)。目前,克服上述挑戰(zhàn)的一個思路是對現(xiàn)有的神經(jīng)網(wǎng)絡(luò)壓縮以適配設(shè)備部署條件?,F(xiàn)階段常用的模型壓縮算法有剪枝、量化、知識蒸餾,多種方法優(yōu)勢互補同時聯(lián)合壓縮可實現(xiàn)更好的壓縮加速效果,正成為...