講座題目:STD:使用自我注意辨別器來改善語音合成
主 講 人:金澎
講座時間:2024年11月26日下午4:30-6:00
講座地點:特教C402
參加人員:電子信息與人工智能學(xué)院師生
講座主要內(nèi)容:生成對抗網(wǎng)絡(luò)(GANs)已經(jīng)被有效地應(yīng)用于聲碼器任務(wù),使其能夠以超過實時的速度從聲學(xué)表示中重建音頻波形,。然而,,使用現(xiàn)有的基于gan的聲編碼器合成高保真音頻仍然是一項具有挑戰(zhàn)性的任務(wù),。使用卷積神經(jīng)網(wǎng)絡(luò)(CNNs)的鑒別器在捕獲長周期序列中的復(fù)雜模式方面表現(xiàn)出訓(xùn)練效率低下和不足,。為了克服這些問題,,本研究引入了STD,,一種新的鑒別器,,利用自我注意機(jī)制,,自動突出周期結(jié)構(gòu)中的關(guān)鍵信息,。與cnn不同,,這種機(jī)制同時處理序列數(shù)據(jù)中的所有特征,有效地捕獲了長期依賴關(guān)系,。我們對LibriTTS和VCTK的實驗分析表明,,該方法顯著提高了訓(xùn)練效率和語音生成的質(zhì)量。此外,,在客觀評價指標(biāo)方面的顯著改進(jìn),,強(qiáng)調(diào)了我們的方法的有效性和潛力。我們在: https://上發(fā)布了我們的代碼和模型,。
金澎專家簡介
金澎,,博士、教授,、碩士生導(dǎo)師,。電子信息與人工智能學(xué)院院長,互聯(lián)網(wǎng)自然語言智能處理四川省高校重點實驗室主任,。2009年7月畢業(yè)于北京大學(xué)信息科學(xué)技術(shù)學(xué)院計算語言學(xué)研究所,,獲理學(xué)博士學(xué)位。主要研究領(lǐng)域為自然語言處理,。在人工智能和自然語言處理國際頂級會議和期刊如AAAI, IJCAI等發(fā)表論文多篇,;授權(quán)國家發(fā)明專利一項;主持完成國家自然科學(xué)基金兩項,;翻譯學(xué)術(shù)專著一部,。四川省學(xué)術(shù)技術(shù)帶頭人后備人選,2018年獲四川省教學(xué)成果二等獎一項,。
主辦單位:
互聯(lián)網(wǎng)自然語言智能處理四川省高學(xué)校重點實驗室
樂山人工智能現(xiàn)代產(chǎn)業(yè)學(xué)院
電子信息與人工智能學(xué)院
2024年11月25日