基于深度學(xué)習(xí)的聲音識別技術(shù)
立即咨詢
從聲音特性角度來看,聲音可以劃分為語音、音樂、環(huán)境音三大類,
而目前主流的語音識別及聲紋識別技術(shù)都是針對語音信號處理的,技術(shù)發(fā)展得已經(jīng)相對成熟了。
PFU上海集團長期致力于環(huán)境音AI識別技術(shù)的研發(fā)。
針對需要辨別特定聲音的應(yīng)用場景,我們事先采集聲音樣本,進行AI深度學(xué)習(xí)和訓(xùn)練。
讓識別引擎自我學(xué)習(xí),最終在實際現(xiàn)場中,能夠識別,甄別特定種類的聲音。
在人工智能國際性權(quán)威競賽DCASE 2018中取得過總冠軍(聲音識別領(lǐng)域)。
可以將一個復(fù)雜的環(huán)境中的聲音進行辨別和分類。
(需要事先對辨別的聲音進行學(xué)習(xí),一種聲音大約需要200個聲音樣本)
【DCASE2018 Task4 世界冠軍】
異常音識別
針對異常音捕捉較困難的場景,
采用正常音學(xué)習(xí)和訓(xùn)練的方法,識別異常音的技術(shù)。
【DCASE2020 Task3 世界第6名】
三種和道路安全密切相關(guān)的聲音事件AI識別。
把聲音事件的AI識別和視頻監(jiān)控的圖像分析相結(jié)合,
解決了以前僅靠圖像識別所不能解決的問題!
預(yù)測以上六種機械發(fā)出的聲音里面是否包含異常音,
檢測技術(shù)對于實際現(xiàn)場業(yè)務(wù)的適用性強!
基于深度學(xué)習(xí)的聲音識別技術(shù)
立即咨詢