雷達信號處理重點實驗室陳渤教授團隊研究成果被頂會NeurIPS2022錄用
(通訊員 徐逸石 王東升)近日,第36屆神經信息處理系統大會(Advances in Neural Information Processing Systems,簡稱NeurIPS,https://nips.cc/)公布了其論文錄用結果。作為國際公認的人工智能和機器學習領域頂級會議,NeurIPS大會每年都吸引了學術界和工業界的廣泛關注,其收錄的論文也代表了領域當今最前沿的研究成果。本次,雷達信號處理國家級重點實驗室陳渤教授團隊共有三篇文章被NeurIPS2022錄用,包括博士生王東升與徐逸石相互合作的兩項研究成果,分別為《Knowledge-Aware Bayesian Deep Topic Model》和《HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding》以及本科畢業于我校“畢德顯班”的李曄文與團隊畢業生、目前在新加坡南洋理工做博士后的王超杰合作完成的《Alleviating Posterior Collapse in Deep Topic Models via Policy Gradient》。
近年來,陳渤教授團隊在認知概率模型研究領域持續發力。多項研究成果延續了團隊在ICML2022、ICLR2022和NeurIPS2021的系列工作,為深度概率模型引入領域知識提供了前沿的理論指導,并進一步提升了模型推理速度和算法靈活性,向模型實用性和落地邁進了一步。
王東升與徐逸石合作的《Knowledge-Aware Bayesian Deep Topic Model》提出了一種在概率建模過程中引入先驗領域知識的新方法,可以幫助模型學習到更加符合人類認知的層次化概念表示。與完全基于數據似然的方法不同,本文所提出的模型通過將單詞和主題嵌入到同一向量空間中從而實現對文檔和先驗知識的聯合建模。基于圖卷積神經網絡的編碼器使得語義相似的主題和單詞之間可以進行信息交換。此外,借助先進的自適應圖技術,本文還提出了一個模型的擴展版本,該擴展旨在引導模型對所提供的先驗主題結構進行完善以匹配目標語料庫。模型的主要思想如下圖所示。
另一工作《HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding》同樣由徐逸石和王東升合作完成。鑒于歐式空間在表達層次關系方面的基本限制,本文提出了一種基于雙曲嵌入的知識表示方法。雙曲空間是一種曲率為負常數的空間,擁有與樹結構相類似的性質,因此在表示層次化數據方面有著天然的優勢。本文提出的模型將單詞和主題嵌入到同一雙曲空間,利用雙曲空間中特殊的距離度量來挖掘單詞之間的語義層級關系,進而幫助模型發現數據中更加可解釋的概念。此外,考慮到實際應用中先驗知識對提升模型性能的重要性,本文進一步提出了一個基于對比學習思想的正則項,它可以有效地將外部結構化的知識注入模型當中從而引導模型挖掘出用戶所感興趣的概念關系圖。模型的整體結構如下圖所示。
值得注意的是,電子工程學院2017級李曄文同學本科畢業于我校“畢德顯班”(現已前往新加坡南洋理工大學攻讀博士),他將自己在陳渤教授指導下開展的本科畢設研究成果進一步完善,也成功被 NeurIPS2022錄用。一方面體現了學校及學院對本科生全面素質教育的重視,反映了雷達信號處理國家級重點實驗室對“畢德顯班”本科生人才培養工作的支持與成效。另一方面也為“畢德顯班”的后輩樹立了榜樣,為本科生科研道路規劃提供了指引,希望能激勵本科生在學有余力的情況下盡早接觸科研,以興趣為動力,更好地驅動科研創新。