近日,計算機學院2023級研究生查全興(導師:柳欣教授)以第一作者身份在國際學術期刊《IEEE圖像處理匯刊》(IEEE Transactions on Image Processing)上發表題為UCPM: Uncertainty-Guided Cross-Modal Retrieval with Partially Mismatched Pairs的研究論文。這一成果標志著計算機學院在圖像處理與人工智能領域的研究取得了新突破,獲得了國際學術界的高度關注。
《IEEE圖像處理匯刊》是國際電氣工程師協會(IEEE)下圖像處理領域的頂級期刊,是中科院SCI期刊分區大類分區一區TOP期刊、中國計算機學會CCF推薦的計算機圖形學與多媒體領域的三大A類期刊之一,2025年影響因子為10.8。
跨模態檢索(如圖文互搜)需依賴大量精準對齊的標注數據,但人工標注成本高昂,如何從噪聲數據中學習魯棒的匹配模型已經成為熱點的研究話題。現有方法通常將數據簡單劃分為“干凈”和“噪聲”兩類,但難以應對語義模糊的邊界樣本。UCPM創新地引入不確定性動態評估機制,通過建模樣本潛在語義的置信度,將訓練數據細分為“高置信匹配對”“易識別噪聲對”以及“難區分邊界對”三個子集,顯著提升數據利用效率。該框架將認知科學中的不確定性理論融入跨模態噪聲關聯學習,攻克了傳統二值劃分導致的誤差累積難題。該研究在三個公開數據集上進行了大量實驗,突出了所提出框架的優越性能,并展示了與國內外先進方法相比的競爭性。
我校為該論文第一完成單位,計算機學院柳欣教授為通訊作者。我校計算機學院彭淑娟教授、香港浸會大學張曉明講席教授、電子科技大學徐行教授以及西安電子科技大學王楠楠教授參與了該研究工作。
該研究工作得到了福建省大數據智能與安全重點實驗室、計算機視覺與機器學習福建省高校重點實驗室、廈門市計算機視覺與模式識別重點實驗室的實驗設備支持。
研究成果在線發表截圖
(責編:鄭藝晗)