“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項目獲國家科技進(jìn)步獎一等獎


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時(shí)間:2024-07-01





  6月24日,2023年度國家科學(xué)技術(shù)獎在京揭曉,共評選出250個(gè)項目。其中,由科大訊飛股份有限公司牽頭,聯(lián)合中國科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為終端有限公司、中移(杭州)信息技術(shù)有限公司等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項目榮獲2023年度國家科技進(jìn)步獎一等獎。


  據了解,多語(yǔ)種智能語(yǔ)音技術(shù)對于支撐人機交互、人類(lèi)語(yǔ)言互通等具有重大戰略意義,產(chǎn)業(yè)前景廣闊。


  為解決語(yǔ)音識別研究中遠場(chǎng)、噪聲、多人語(yǔ)音混疊等難題,該項目提出了多通道語(yǔ)音信號時(shí)空分離建模方法和多維度語(yǔ)音屬性解耦表征方法,實(shí)現語(yǔ)音信號中內容、噪聲等高度耦合的多維屬性特征解耦,使得復雜場(chǎng)景下語(yǔ)音識別準確率得到重大突破。


  為應對小語(yǔ)種智能語(yǔ)音系統構建所面臨的知識匱乏、訓練數據稀缺等難題,科大訊飛設計了全新的多語(yǔ)種通用音素體系和基本語(yǔ)言單元,實(shí)現多語(yǔ)種統一音素韻律體系的構建,又通過(guò)基于元學(xué)習的多語(yǔ)種預訓練和基于語(yǔ)族分組的多語(yǔ)種共享建模。通俗地說(shuō),就是將不同的小語(yǔ)種進(jìn)行分類(lèi),找到同類(lèi)語(yǔ)種的共同規律,進(jìn)行分析建模和訓練,最終顯著(zhù)提升了小語(yǔ)種語(yǔ)音系統性能。


  同時(shí),為解決復雜應用場(chǎng)景下語(yǔ)音交互、語(yǔ)音翻譯面臨著(zhù)深層次語(yǔ)義理解困難、專(zhuān)業(yè)性不足等問(wèn)題,科大訊飛提出語(yǔ)音語(yǔ)義互增強的魯棒口語(yǔ)理解技術(shù),有效提升語(yǔ)音交互、語(yǔ)音翻譯等復雜場(chǎng)景的語(yǔ)義理解準確率;提出多源知識增強的可信文本生成技術(shù),提升專(zhuān)有詞匯及領(lǐng)域知識引用的準確率。


  目前,該技術(shù)成果得到廣泛應用。以智能手機為例,項目支持各主流手機廠(chǎng)商累計激活設備超10億臺;智能汽車(chē)方面,車(chē)載智能化產(chǎn)品累計前裝超5300萬(wàn)套。此外,該項目還構建了多語(yǔ)種智能語(yǔ)音技術(shù)及全球產(chǎn)業(yè)生態(tài),2017年開(kāi)始承建的智能語(yǔ)音國家新一代人工智能開(kāi)放創(chuàng )新平臺,已聚集平臺開(kāi)發(fā)者數700.7萬(wàn),終端設備數40.5億。(記者 郭倩)


  轉自:經(jīng)濟參考網(wǎng)

  【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉載時(shí)須獲得授權并注明來(lái)源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀(guān)點(diǎn),不代表本網(wǎng)觀(guān)點(diǎn)和立場(chǎng)。版權事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964