基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的半監(jiān)督網(wǎng)站主題分類
計算機工程與科學(xué)
頁數(shù): 12 2024-04-15
摘要: 互聯(lián)網(wǎng)網(wǎng)站數(shù)量快速增長使現(xiàn)有方法難以準(zhǔn)確分類特定網(wǎng)站主題,如基于URL的方法無法處理未反映在URL中的主題信息,基于網(wǎng)頁內(nèi)容的方法受到數(shù)據(jù)稀疏性和語義關(guān)系捕捉的限制。為此,提出一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的半監(jiān)督網(wǎng)站主題分類方法HGNN-SWT。該方法不僅利用網(wǎng)站文本特征來彌補僅使用URL特征的不足,還利用異構(gòu)圖對網(wǎng)站文本和詞語的稀疏關(guān)系進行建模,通過處理圖中的節(jié)點和邊關(guān)系來提高分類...