shanghai security defense & alarm association 愛建網(wǎng)">
近日,云從科技在語音識別技術(shù)上獲得重大突破,一舉刷新了全球最大的開源語音識別數(shù)據(jù)集Librispeech的世界紀(jì)錄,錯(cuò)詞率(Worderrorrate,WER)降到了2.97%,將Librispeech的WER指標(biāo)提升了25%,超過阿里、百度、約翰霍普金斯大學(xué)等企業(yè)及高校,大幅刷新原先記錄。
此次突破標(biāo)志著云從科技在今年4月刷新跨鏡追蹤技術(shù)(ReID)三項(xiàng)世界紀(jì)錄后在新領(lǐng)域再次取得重大成果,正全力夯實(shí)核心技術(shù)閉環(huán)。
根據(jù)介紹,云從科技核心技術(shù)閉環(huán)包括人臉識別、智能感知與智能分析三個(gè)階段,而此次語音識別突破屬于智能感知中的一環(huán)。智能感知即視覺、聽覺、觸覺等感知能力,能夠讓計(jì)算機(jī)通過各種智能感知能力與外界進(jìn)行交互。
據(jù)了解,Librispeech是當(dāng)前衡量語音識別技術(shù)的最權(quán)威主流的開源數(shù)據(jù)集,錯(cuò)詞率(Worderrorrate,WER)是衡量語音識別技術(shù)水平的核心指標(biāo)。云從科技在Librispeech數(shù)據(jù)集上刷新了業(yè)內(nèi)最好的水平,將錯(cuò)詞率(Worderrorrate,WER)降到了驚人的2.97%,較之前提升了25%,已超越人類專業(yè)速記員水平。
滬公網(wǎng)安備 31011202001934號