面向強(qiáng)化學(xué)習(xí)的可解釋性研究綜述
計(jì)算機(jī)學(xué)報(bào)
頁(yè)數(shù): 30 2024-04-23
摘要: 強(qiáng)化學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一種范式,因其強(qiáng)大的策略試錯(cuò)學(xué)習(xí)能力,受到關(guān)注.隨著深度學(xué)習(xí)的融入,強(qiáng)化學(xué)習(xí)方法在許多復(fù)雜的控制任務(wù)中取得了巨大成功.然而,深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)作為黑盒模型,其缺乏可解釋性所帶來(lái)的不安全、不可控及難理解等問(wèn)題限制了強(qiáng)化學(xué)習(xí)在諸如自動(dòng)駕駛、智慧醫(yī)療等關(guān)鍵領(lǐng)域中的發(fā)展.為了解決這一問(wèn)題,科研人員開(kāi)展了對(duì)強(qiáng)化學(xué)習(xí)可解釋性的研究.然而,這些研究開(kāi)展相對(duì)較晚,且缺少針對(duì)...