?????? 由日本株式會(huì)社PFU和PFU上海計(jì)算機(jī)有限公司聯(lián)合開發(fā)的基于深度學(xué)習(xí)的“環(huán)境音識(shí)別系統(tǒng)”參加了IEEE官方指定的國(guó)際大賽DCASE2018 Challenge的Task4的競(jìng)賽,在50個(gè)參賽系統(tǒng)中脫穎而出,取得了第一名的佳績(jī)。
????? DCASE2018 Challenge是IEEE指定的AASP(Audio and Acoustic Signal Processing) Challenge大賽的一部分,也是IEEE官方指定的音頻和聲學(xué)信號(hào)處理的國(guó)際性權(quán)威競(jìng)賽。Task4是“Large-scale weakly labeled semi-supervised sound event detection in domestic environments”,也就是“在室內(nèi)環(huán)境中的大尺度弱標(biāo)簽半監(jiān)督聲音事件檢測(cè)”。今年的競(jìng)賽內(nèi)容是在給定一段室內(nèi)環(huán)境中的音頻(包括了人的聲音,貓和狗的叫聲,警報(bào)聲,吸塵器的聲音,刮胡子的聲音,油炸食物的聲音等等)中識(shí)別出從第幾秒開始到第幾秒結(jié)束有哪種類型的聲音。
????? PFU上海團(tuán)隊(duì)參加了上述的競(jìng)賽,在與北京清華、中國(guó)科技大學(xué)、上海交大等國(guó)內(nèi)知名大學(xué),以及美國(guó)約翰·霍普金斯大學(xué)、奧地利格拉茨大學(xué)、韓國(guó)電子通信研究院、印度理工學(xué)院等諸多海外研究機(jī)構(gòu)的同臺(tái)競(jìng)技中,取得了第一名的優(yōu)異成績(jī)。準(zhǔn)確率比第二名大幅高出2.5%,比基準(zhǔn)高出21.6%。
????? 近年來(lái)深度學(xué)習(xí)(Deep Learning)技術(shù)飛速發(fā)展,PFU上海團(tuán)隊(duì)時(shí)刻緊盯最前沿技術(shù)的變化,通過不斷鉆研及運(yùn)用,在神經(jīng)網(wǎng)絡(luò)技術(shù)方面積累了豐富的經(jīng)驗(yàn),具備了很強(qiáng)的實(shí)踐能力。在這次競(jìng)賽中,PFU上海團(tuán)隊(duì)充分利用了多年來(lái)對(duì)各種神經(jīng)網(wǎng)絡(luò)技術(shù)研究的經(jīng)驗(yàn),準(zhǔn)確選取了最適合音頻處理的神經(jīng)網(wǎng)絡(luò)的算法,提高了提取語(yǔ)音的聲學(xué)特征的準(zhǔn)確率,為最后的優(yōu)勝奠定了堅(jiān)實(shí)的基礎(chǔ)。而且在傳統(tǒng)模型無(wú)法處理的弱標(biāo)簽數(shù)據(jù)上,嘗試并挑戰(zhàn)了多種最前沿的新模型來(lái)訓(xùn)練以前傳統(tǒng)模型無(wú)法處理的弱標(biāo)簽數(shù)據(jù),通過上下文關(guān)聯(lián)技術(shù)進(jìn)一步強(qiáng)化了聲學(xué)特征,在這些新技術(shù)的運(yùn)用方面,取得了新的突破。
?????? 今后, PFU上海團(tuán)隊(duì)將繼續(xù)深耕AI領(lǐng)域,不斷挑戰(zhàn),勇攀新的高峰。