shanghai security defense & alarm association 愛建網">
大華股份AI斬獲語義分割國際競賽第一
近日,大華股份基于深度學習算法的圖像語義分割技術,刷新了KITTI語義分割競賽(The KITTI Semantic Segmentation Evaluation)全球最好成績,取得語義分割排行榜第一名,超越其他一流AI公司和頂尖的學術研究機構,這標志著大華股份在語義分割領域處于領先水平。
大華股份已建成用于算法訓練的超大規模計算中心和數據中心,重點研究并商用化多個領域算法,已形成核心競爭力。2017年大華股份在場景流、光流和文字識別檢測等領域分別取得第一;2018年在2D車輛目標檢測、MOT跟蹤、行人重識別等國際競賽中分別取得第一;2019年初,在實例分割國際競賽中取得第一。本次在語義分割算法領域再次取得新突破。
關于KITTI:
KITTI數據集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯合創辦,是目前國際上最大的計算機視覺算法評測數據集之一。數據集用于評測立體圖像(Stereo)、光流(Optical Flow)、視覺測距(Visual Odometry)、物體檢測(Object Detection)和跟蹤(Tracking)、道路分割(Road)、語義分割(Semantics)等計算機視覺技術在車載環境下的性能。KITTI包含市區、鄉村和高速公路等場景采集的真實圖像數據,每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
語義分割:
語義分割是指將計算機輸入圖像的每個像素分類為所屬對象類別的過程。它不僅是計算機視覺的基本任務,同時在自動駕駛、機器人場景理解以及虛擬現實方面有著非常重要的應用。
在KITTI語義分割任務中,需要把各種場景下的汽車、行人、道路、摩托車、自行車、交通標志、建筑物和植被等19類物體準確分割出來。同時,訓練集只提供200張數據,屬于小樣本學習。
本次國際比賽,大華股份為提升語義分割精度,汲取了圖像分類、單目標分割和全像素語義分割等先進算法的優點,構建了基于多位置和通道特征的全局關注機制,并采用遷移學習和增量學習方法,有效提升了算法的分割精度。
滬公網安備 31011202001934號