【
儀表網 研發快訊】近日,中國科學院上海微系統與信息技術研究所仿生
視覺系統實驗室李嘉茂研究員、朱冬晨研究員團隊在視覺目標檢測領域取得了重要進展。團隊圍繞圖像探測等復雜場景下的弱小目標檢測提出了創新方法,成果被模式識別與人工智能領域的國際頂級期刊Pattern Recognition(PR,中國科學院1區SCI,IF=7.6)發表,論文題目為"DAWDet: A Dynamic Content-Aware Multi-Branch Framework with Adaptive Wavelet Boosting for Small Object Detection"。
目標檢測是具身智能實現場景理解與環境交互的基石。在圖像探測等典型應用中,受觀測視角、拍攝距離、
傳感器分辨率等成像條件限制,所獲取的圖像中常包含大量微小且密集的關鍵目標。相較于常規尺度目標,小目標因像素占比極低,普遍面臨特征表達能力弱、高質量正樣本稀疏、信息丟失嚴重等固有挑戰。然而,當前主流的先進檢測模型多針對通用場景設計,往往更傾向于優化大、中型目標的檢測性能,導致在小目標檢測任務上存在明顯的性能瓶頸。
為此,團隊創造性提出了一種基于自適應小波增強的動態多分支目標檢測模型DAWDet,通過設計多項針對性機制有效提升弱小目標檢測性能。具體來說,團隊首先設計了一種基于動態內容感知的多分支特征金字塔網絡,通過自適應內容感知點采樣以及精細化的網絡拓撲結構,來獲取更加豐富的小目標位置信息和語義信息。其次,團隊提出了一種自適應匹配的標簽分配策略,對不同質量的目標預測框進行差異性建模,通過設計的重疊轉換函數來提升高質量小目標樣本的回歸分數。此外,針對小目標信息丟失嚴重的問題,團隊在特征融合階段設計了多個輕量的小波變換下采樣層,針對性地捕捉小目標低頻全局和高頻局部細節信息,以此提升小目標特征信息的利用率。該模型在無人機場景數據集Visdrone-2019、可見光-熱紅外數據集RGBT-Tiny以及駕駛場景數據集SODA-D上性能全面超越目前先進目標檢測器,在檢測精度和模型規模方面均體現了明顯優勢,同時展現了在紅外數據上的良好泛化性。
本研究成果得到了科技部科技創新2030、中國科學院青促會、上海市優秀學術帶頭人等項目支持。上海微系統所仿生視覺系統實驗室碩士研究生吳雨婷、博士后劉紹雷為論文共同一作,李嘉茂研究員、朱冬晨研究員為通信作者。
所有評論僅代表網友意見,與本站立場無關。