中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

特斯聯(lián)實現(xiàn)計算機視覺科研突破 多項成果入選國際頂會頂刊

http://m.casecurityhq.com 2022-06-22 14:12 來源:上海證券報

  作為成渝地區(qū)東數西算的深度參與者,特斯聯(lián)近期對外公布了其計算機視覺(CV)領域的多個科研突破,并有8篇論文被CVPR、TPAMI等頂級國際學術會議和期刊收錄。

  此次,特斯聯(lián)在CV領域的科研突破涵蓋語義分割、圖像增強、顯著物體識別、遷移學習、行為識別等方面。其中不少創(chuàng)新技術打破了現(xiàn)有技術上限,亦開發(fā)了數個性能更優(yōu)、識別更快、效率更高的模型,這些技術研究的應用與推廣將成為特斯聯(lián)賦能城市數字化、智能化的有力保障。

  在機器視覺行業(yè)產業(yè)鏈中,如上游的光源、鏡頭、工業(yè)相機、圖像處理器、圖像采集卡等硬件,圖像處理軟件和底層算法等軟件系統(tǒng)會隨著機器視覺的迭代而快速發(fā)展,推進整個產業(yè)鏈的升級。特斯聯(lián)集團首席科學家兼特斯聯(lián)國際總裁邵嶺博士及其團隊在該領域中提出的圖像和視頻的識別和學習各算法,極大縮短了訓練和推理時間,從圖像識別提升、識別效率提升以及解決數據標注瓶頸三個方面,提升了整體視覺應用效果。

  圖像識別提升方面,團隊的技術突破主要集中在算法層面,囊括背景消除模塊、圖像特征突出等。這些可以從圖像本質入手,豐富圖像本身信息,去除多余噪點,為后續(xù)圖像識別提供高清的圖像數據,是高效率識別的基礎。更有技術突破采用創(chuàng)新手法,如加上聲音信息來協(xié)助識別,提高信息準確度。

  為提高識別效率,團隊研究出新的算法框架以及新的采樣器,可以顯著提高識別效率,大大縮短訓練時間。在圖像識別中,快速的識別可以提高服務質量,減少延遲,讓人們感受更智能的交互。

  此外,特斯聯(lián)團隊還解決了圖像標注問題。數據標注是一個重要的過程,傳統(tǒng)人工數據標注費時費力。團隊提出了一種新的類別對比技術(CaCo),該技術在無監(jiān)督域適應(UDA)任務的實例判別之上引入語義先驗,可以有效地用于各種視覺UDA任務。該技術構建了一個具有語義感知的字典,其中包含來自源域和目標域的樣本,每個目標樣本根據源域樣本的類別先驗分配到一個(偽)類別標簽,以便學習與UDA目標完全匹配的類別區(qū)分但域不變的表征。

  與當下最先進的方法對比,簡單的CaCo技術可以實現(xiàn)更優(yōu)越的性能表現(xiàn),也可以成為現(xiàn)有UDA方法的補充,推廣到其他機器學習方法中去,如無監(jiān)督模型適應,開放/部分集適應等。該技術解決了傳統(tǒng)監(jiān)督學習需要大量人工標注的問題,比現(xiàn)有技術擁有更高的效率。

版權所有 中華工控網 Copyright?2024 Gkong.com, All Rights Reserved