shanghai security defense & alarm association 愛建網">
近日,在由全球多媒體領域頂級學會ACM MM主辦的“大規模復雜場景人體視頻解析”挑戰賽中,依圖算法奪得第一,評價指標wf-mAP@avg達0.26,將以往學術界中的基準算法提升了近3倍,以絕對優勢奪得“行為識別”賽道冠軍。
行為識別是指以人為基礎單位,只分析人的行為,關注單人的動作以及多人的動作。這項技術正在智能城市、安全生產、智能商業、智慧娛樂等社會生產生活的方方面面起到作用,比如實時檢測工人是否遵循操作流程生產作業以防暴力分揀、針對短視頻中人的行為進行摘要理解從而自動為用戶推薦視頻。
學術界以往常用f-mAP@avg來作為行為識別的評價指標,此次競賽采用的評價指標wf-mAP@avg更注重對難度較大的擁擠場景的考察和少見動作的識別,同時對于人體框的定位精確性要求也更高。
由于挑戰賽是首次舉辦,參賽團隊在賽前無法獲取識別的類別、數據集的大小和識別的具體需求。在不到兩個月里,依圖將算法與場景進行深度結合,從視頻中自動提取到了準確豐富的場景信息,并借助多年來的算法積淀和對行業場景的理解等“先驗知識”,對特定的14類任務進行了深度算法優化。
在此基礎上,依圖團隊在僅使用單模型的情況下,取得了優于其他團隊使用復雜多模型融合策略取得的成績。同時,這也意味著依圖仍可以進一步通過融合多個模型提升算法性能。
目前,依圖行為識別算法的性能仍在持續迭代,實際運用該技術落地實戰的項目難度已遠超比賽的數據集。未來,依托于高性能自研AI芯片,依圖將加速AI技術落地、解鎖更多城市生產生活場景。
關于 ACM MM Grand Challenge
ACM是全球最大的計算機領域專業性學術組織,其評選的圖靈獎(A.M.Turing Award)被公認為世界計算機領域的諾貝爾獎。而ACM MM是全球多媒體領域的頂級會議,屬中國計算機學會(CCF)指定的A類國際會議。
在此次比賽中,包括亞馬遜、騰訊、大華科技、中山大學等上百支隊伍參與了超過56000個復雜事件下的人體行為解析。該比賽也是行為識別方向最接近真實場景的大規模挑戰賽。
滬公網安備 31011202001934號