shanghai security defense & alarm association 愛建網(wǎng)">
2023年7月,依圖發(fā)布了智能安防領(lǐng)域首個(gè)可實(shí)戰(zhàn)可商用的多模態(tài)大模型—依圖天問1.0。發(fā)布至今,依圖天問大模型基座已完成了兩次迭代升級(jí),并率先在全國50多個(gè)項(xiàng)目中部署應(yīng)用。
近日,在第十屆中國(上海)國際技術(shù)進(jìn)出口交易會(huì)上,依圖科技最新版本的“依圖天問大模型4.0”正式發(fā)布,以全新的交互體驗(yàn)、超高的進(jìn)化能力,重新定義了多模態(tài)大模型在智能安防領(lǐng)域的應(yīng)用邊界。
此次發(fā)布的依圖天問大模型4.0實(shí)現(xiàn)了眾多功能的跨越式升級(jí):融合自然語言與視覺信息,大幅提升視頻內(nèi)容的模糊檢索能力;支持多條件組合場景布控,實(shí)現(xiàn)精細(xì)化布控和風(fēng)險(xiǎn)管理;依圖天問4.0升級(jí)后的預(yù)訓(xùn)練模型支持算法極少樣本冷啟動(dòng),通過Agent代理輔助訓(xùn)練,真正實(shí)現(xiàn)了“想法既算法”的智能飛躍。
視頻理解更細(xì)微,語義檢索更豐富
語言交互的模糊性來源于語境的多樣性。依圖天問4.0引入多模態(tài)視覺搜索技術(shù),將自然語言與視覺信息融合,以“用戶”為主,深刻理解語境中的細(xì)微差別,例如:當(dāng)需要搜索“騎電動(dòng)車帶多個(gè)煤氣罐”的視頻內(nèi)容時(shí),用戶只需用日常語言描述需求,系統(tǒng)便可呈現(xiàn)出最貼近意圖的搜索結(jié)果。同時(shí),還可以針對(duì)視頻內(nèi)容里細(xì)小目標(biāo)做模糊化檢索。這些能力極大地提升了城市管理者日常運(yùn)營和決策調(diào)度中的工作效率,降低了溝通成本。
(上圖示例:“前燈破損的汽車”,系統(tǒng)不僅能理解抽象的描述,還迅速反饋出精確的圖像結(jié)果)
全要素理解、多條件布控更全面
高精度的視頻內(nèi)容理解,解鎖了復(fù)雜視頻場景布控的可能。機(jī)器可以代替人去看視頻,像人一樣看"懂"視頻,對(duì)視頻內(nèi)容進(jìn)行全場景、全要素的理解,就可以對(duì)典型的場景目標(biāo)和規(guī)則進(jìn)行精準(zhǔn)布控,提前預(yù)警潛在風(fēng)險(xiǎn),科學(xué)高效地輔助決策。依圖天問4.0支持多條件組合的場景布控,可幫助管理者進(jìn)行精細(xì)化風(fēng)險(xiǎn)防控和管理。在城市管理、環(huán)境監(jiān)測、公共安全等領(lǐng)域,這項(xiàng)技術(shù)展現(xiàn)出極高的實(shí)戰(zhàn)應(yīng)用價(jià)值。
(上圖示例:城市攝像機(jī)對(duì)“嚴(yán)重積水的涵洞”的歷史事件進(jìn)行搜索的結(jié)果)
樣本更少更高效,現(xiàn)場訓(xùn)練更靈活
智能系統(tǒng)的一大特征是可以根據(jù)環(huán)境和需求的變化快速適配。傳統(tǒng)的機(jī)器學(xué)習(xí)模型面對(duì)新的算法任務(wù),需重新收集數(shù)據(jù)、訓(xùn)練模型,至少要1-3個(gè)月。依圖天問4.0升級(jí)了預(yù)訓(xùn)練模型,可實(shí)現(xiàn)1分鐘內(nèi)對(duì)極少樣本的新算法進(jìn)行冷啟動(dòng),1小時(shí)內(nèi)完成在線標(biāo)注訓(xùn)練,1天內(nèi)快速部署上線。通過日常工作過程中快速積累的數(shù)據(jù)飛輪,操作人員每天花幾分鐘對(duì)齊數(shù)據(jù)、簡單點(diǎn)擊對(duì)錯(cuò),幾天時(shí)間就可讓算法達(dá)到超過90%的準(zhǔn)確率,展現(xiàn)出前所未有的智能化和靈活性,充分滿足業(yè)務(wù)系統(tǒng)的敏捷性和管理的時(shí)效性。
(上圖示例:排查“烈性犬”,少樣本對(duì)齊烈性犬,吉娃娃、拉布拉多、田園犬則極少出現(xiàn))
想法即算法,Agent輔助更智能
Agent(代理)在多模態(tài)大模型體系里扮演著至關(guān)重要的角色。AI Agent能夠基于歷史交互記錄和現(xiàn)有的算法能力,做出更為精準(zhǔn)的決策輔助。依圖天問4.0可輔助逐步對(duì)齊認(rèn)知,解構(gòu)重組算法。例如:當(dāng)我們想訓(xùn)練一個(gè)“大型倉庫里的小型叉車”,Agent會(huì)針對(duì)“大型倉庫”和“小型叉車”的語義做對(duì)齊,從而使得用戶的想法可以快速轉(zhuǎn)化為直觀的算法,讓用戶的每一個(gè)想法都能即時(shí)轉(zhuǎn)化為直觀的操作指令,實(shí)現(xiàn)“想法即算法”的飛躍,呈現(xiàn)出工作助手、智能體的靈動(dòng)與高效特征。
(上圖示例:訓(xùn)練“大型倉庫里的小型叉車”,Agent對(duì)“大型倉庫”“小型叉車”的語義做對(duì)齊)
滬公網(wǎng)安備 31011202001934號(hào)