近日,我校計算機學院張洪博副教授課題組一項關于圖像中人物交互行為檢測的研究成果(題為“Interaction Confidence Attention for Human-Object Interaction Detection”),在中國計算機學會(CCF)推薦的人工智能A類頂級學術期刊International Journal of Computer Vision (IJCV) 2025年第8期上正式發表。
圖像中的人物交互理解是計算機視覺研究中的一項重要挑戰,是實現圖像內容高語義理解的關鍵技術之一。同時,注意力機制是當前人工智能模型的內在關鍵技術之一。張洪博副教授課題組的工作中主要探討了基于Transformer架構的人-物交互檢測方法,利用圖像中的人-物關鍵點構建了可學習的查詢生成器,并設計了一種新的面向人-物交互任務的注意力計算方法,并行地實現人體檢測、物體檢測及其交互識別。該研究在人-物的通用數據集上進行了大量實驗,驗證了所提出方法的有效性。

該研究模型在不同場景中的注意力可視化
IJCV,即國際計算機視覺期刊,是由Springer發行的計算機視覺領域頂級學術期刊,被CCF認定為A類學術期刊。該期刊主要發表計算機視覺領域最新研究成果,包括但不限于目標檢測、圖像理解、視覺推理、深度學習、幾何計算等方向,是計算機視覺領域最具影響力的期刊之一。
在該研究工作中,我校為第一完成單位,計算機學院張洪博副教授為第一作者,2021級軟件工程專業碩士生林王凱為第二作者,雷慶副教授、劉景華副教授、杜吉祥教授和2023級計算機技術專業研究生蘇杭參與。研究工作得到福建省大數據智能與安全重點實驗室、福建省計算機視覺與機器學習高校重點實驗室、廈門市計算機視覺與模式識別重點實驗室的大力支持。
近幾年,該課題組針對人體行為理解的相關任務展開系統性的研究,在IEEE TIP、ECCV、ACM TOMM等計算機視覺和圖像處理領域的頂級期刊和會議發表了多項相關研究成果。
(責編:張羅應)