近日,我校電子工程學院(人工智能學院)國家精準農(nóng)業(yè)航空施藥技術(shù)國際聯(lián)合研究中心蘭玉彬教授團隊在人工智能頂級期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI,中科院一區(qū),影響因子24.31)在線發(fā)表了題為“Explanatory Object Part Aggregation for Zero-Shot Learning”的研究論文(論文鏈接:https://ieeexplore.ieee.org/document/10287616)。本論文提出一種零樣本識別方法(ZSL),旨在識別未在訓練樣本中出現(xiàn)過的不可見類目標。
傳統(tǒng)的零樣本識別方法大都專注于優(yōu)化特征空間或生成不可見類的虛擬視覺特征,存在大量使視覺特征和語義屬性不匹配的虛擬連接,降低了識別性能。本論文提出基于類激活特征構(gòu)建可解釋圖的方法,全面挖掘細粒度的目標區(qū)域,提升深度網(wǎng)絡預測結(jié)果。基于該方法下,聚合后的目標區(qū)域包含可全面激活語義屬性的豐富視覺特征,可以在很大程度上減少虛擬連接的影響。同時該論文設計了一個新型特征蒸餾網(wǎng)絡,將局部特征蒸餾到全局網(wǎng)絡中,進一步識別精度。在AWA2、CUB、FLO和SUN數(shù)據(jù)集上的實驗結(jié)果表明,該論文提出的方法在傳統(tǒng)的ZSL和GZSL任務中均大幅度超越了現(xiàn)有技術(shù)。
可解釋圖構(gòu)建和蒸餾網(wǎng)絡示意圖
自2021年來,陳欣課題組在蘭玉彬教授的帶領下,在人工智能領域開展了一系列的研究工作,取得突出成績,成果相繼發(fā)表在IEEE transactions on image processing(中科院一區(qū),IF:10.6),IEEE transactions on neural networks and learning systems(中科院一區(qū),影響因子14.3)等頂級期刊上。
陳欣副教授為文章第一作者,鄧小玲教授為文章通訊作者,蘭玉彬教授為文章合作作者。該研究得到國家自然科學基金項目、高等學校學科創(chuàng)新引智計劃、國家棉花產(chǎn)業(yè)技術(shù)體系項目、廣東省重點研發(fā)計劃、廣東省自然科學基金和學校科研創(chuàng)新能力提質(zhì)增效專項等資助。
文圖/電子工程學院(人工智能學院)