人工智能可從嘈雜聲中分辨特定聲音
人工智能(AI)設備已經能處理來自獨立個人的請求,但跟我們一樣,它們在嘈雜的雞尾酒會上或幾個人同時發(fā)言的情況下,www.whsntf.cn,www.whsntf.cn,也會感到糾結!缎驴茖W家》雜志官網(wǎng)近日文章稱,美國劍橋三菱電機研究實驗室的研究人員開發(fā)出的聲音識別AI設備,能實時分離多個聲源,大大提升了自動語言識別能力。
這項技術首次在日本東京先進技術綜合展覽會上公開展示,被團隊稱為深度聚類機器學習,可識別多個聲源聲紋中的獨特功能。然后,將每個演講者聲音的不同特征組合在一起,允許它從多個聲音中將特定特征的聲音選出來,最后重建每個人的話語。智能技術使用了多名人士講的英語進行了培訓和學習,即便說話人是日本人,也能輕松地分辨出來。
據(jù)介紹,傳統(tǒng)識別語音的方法,利用兩個收音器模擬聽眾兩耳朵的位置,只能達到51%的準確性,形成的雞尾酒會效應困擾了AI研究幾十年。
新智能系統(tǒng)可以將兩個人的語音成功分離,KUKA機器人示教器維修,而且,重建單人語音的精確度高達90%,新技術可幫助家庭和汽車更好地執(zhí)行智能任務,一次可分離多達5個人的聲音,可用于電梯、空調機組和家用產品的智能操控。