騰訊云正式發(fā)布金融、音視頻等多個領(lǐng)域?qū)僬Z音識別模型
4月29日,騰訊云正式發(fā)布金融、音視頻等多個領(lǐng)域?qū)僬Z音識別模型。最新發(fā)布的模型不僅識別準確率得到大幅提升,同時也增加了對粵語、韓語的支持,后面會陸續(xù)開放對上海話等方言以及日語、泰語、印尼語等國外語言的支持。
正式發(fā)布金融行業(yè)專屬模型,字準率業(yè)界領(lǐng)先
據(jù)了解,語音識別在金融行業(yè)應(yīng)用場景廣泛,但是實際場景下,很多用戶都是使用方言在和外呼、客服機器人交流,加上金融領(lǐng)域有著大量的專有句式和詞匯,市場上目前通用的語音識別模型存在識別不準的情況。
基于這些的痛點,騰訊云AI團隊與微信智聆聯(lián)合打造了金融行業(yè)專屬語音識別模型,這個模型的推出不僅能夠有效解決上述難題,還在識別的準確率上得到大幅提升。目前該模型已經(jīng)在金融領(lǐng)域的智能外呼、智能客服、電話錄音質(zhì)檢等多個場景落地。經(jīng)客戶實測,字準率在業(yè)界處于領(lǐng)先水平。

率先打造音視頻專屬語音識別模型,準確率提升10%
隨著互聯(lián)網(wǎng)直播浪潮的興起,如何利用智能語音技術(shù)快速識別用戶的音視頻內(nèi)容、進行精準推薦和不健康內(nèi)容過濾,已經(jīng)成為各大直播和內(nèi)容分享平臺在日益激烈的市場競爭中的核心競爭力。但由于音視頻背景環(huán)境復(fù)雜且屬于半遠場,需要有大量數(shù)據(jù)積累才能實現(xiàn)準確識別。
憑借自身在音視頻領(lǐng)域數(shù)據(jù)的大量積累,騰訊云在業(yè)界率先推出了音視頻領(lǐng)域?qū)僬Z音識別模型,目前已在多家音視頻領(lǐng)域直播平臺和電商直播平臺應(yīng)用,經(jīng)客戶實測,識別準確率提升近10%。

語種豐富度進一步提升,騰訊云語音識別加速落地



