像人一樣自然聊天,F(xiàn)acebook的AI機(jī)器人成精了
談到人工智能,很多人都會(huì)想起Google的AlphaGo和TensorFlow,而Facebook的AI團(tuán)隊(duì)就顯得較為低調(diào)了。雖然低調(diào),但其團(tuán)隊(duì)不僅有頂級人才坐鎮(zhèn)學(xué)術(shù)探索,同時(shí)有先鋒團(tuán)隊(duì)實(shí)際應(yīng)用。
近日,F(xiàn)acebook的AI實(shí)驗(yàn)室開發(fā)出了一款名叫Ink的動(dòng)畫聊天機(jī)器人,這款機(jī)器人通過人工智能算法控制動(dòng)畫實(shí)現(xiàn)了在與人交談的過程中對人的面部表情做出反應(yīng),做出的反應(yīng)很自然,以至于讓人覺得它和人類幾乎沒有什么差別。
68個(gè)關(guān)鍵點(diǎn)的準(zhǔn)確識別
機(jī)器人的研發(fā)過程中多數(shù)會(huì)遇到「恐怖谷效應(yīng)」,人形機(jī)器人的相似度與人類的好感度不成正比,隨著物體擬人程度增加,人類的反應(yīng)呈增-減-增曲線,當(dāng)擬人度達(dá)到某一程度時(shí),人類好感度會(huì)大幅下降,庫卡機(jī)器人,甚至還會(huì)覺得擬人物驚悚可怕。而Facebook研發(fā)的可以表達(dá)情緒的機(jī)器人讓我們距離攻克這個(gè)障礙又近了一步。
在我們與他人交談的過程中,數(shù)以百萬計(jì)的微小肌肉的運(yùn)動(dòng)改變了我們眼睛,嘴巴以及頭部的位置,而這些位置的改變向正在與我們交流的對象發(fā)出了我們正在作何思考的信號。AI實(shí)驗(yàn)室根據(jù)這個(gè)特性利用人工智能對聊天機(jī)器人進(jìn)行數(shù)百個(gè)Skype視頻對話訓(xùn)練,讓它學(xué)習(xí)然后模擬人類是如何轉(zhuǎn)換他們的表情來回應(yīng)其他人的。
為了更好的明確人類是如何轉(zhuǎn)換他們的表情來回應(yīng)其他人的,在Skype視頻對話期間,研究人員將視頻畫面中的人臉選出68個(gè)關(guān)鍵點(diǎn),機(jī)器人維修,然后在每組對話中全程跟蹤對話者臉上的這68個(gè)關(guān)鍵點(diǎn)。在學(xué)習(xí)一段時(shí)間后,動(dòng)畫機(jī)器人可以實(shí)時(shí)預(yù)測可能出現(xiàn)的面部表情。如果對視頻中人所說的東西表示認(rèn)同,機(jī)器人就會(huì)點(diǎn)下頭;如果視頻中人在笑,機(jī)器人也可能開嘴笑。
自然且真實(shí)的反應(yīng)
在這款機(jī)器人大量學(xué)習(xí)之后,F(xiàn)acebook的團(tuán)隊(duì)讓志愿者們觀看動(dòng)畫視頻來測試系統(tǒng),這些動(dòng)畫視頻包括人和人對話的原版視頻,以及訓(xùn)練后的機(jī)器人模擬的反應(yīng),而志愿者最終給出的結(jié)果是這款機(jī)器人有著和人類近乎一致的反應(yīng),反應(yīng)自然且真實(shí)。
測試結(jié)果顯示在交談過程中,聊天動(dòng)畫機(jī)器人與人類在嘴部和眼部有著幾近相同的張合度,機(jī)器人對表情的預(yù)測也與正常人類的表情基本一致。
目前Facebook的這款聊天機(jī)器人做出的反應(yīng)還只能是以動(dòng)畫的形式展現(xiàn),現(xiàn)在的算法還不支持將這種做出的反應(yīng)直接應(yīng)用到更加逼真的類人的機(jī)器人身上。
未來仍有新高度
在這個(gè)案例中,F(xiàn)acebook開發(fā)的聊天機(jī)器人只是創(chuàng)造了一種普通的「人格」,一位來自以色列的AI研究員表示。此外他還稱,對AI來說,真正理解面部交流而不僅僅是模仿是很重要的,真實(shí)的面部表情是基于人類當(dāng)時(shí)的想法和感受而展現(xiàn)的,目前這種通過學(xué)習(xí)來展現(xiàn)基本表情的方式還不足以創(chuàng)造出真實(shí)的對話模式。
相比于動(dòng)畫機(jī)器人,人類更加喜歡與能夠模仿人類自身面部表情的機(jī)器人交流,但目前機(jī)器人不是很擅長掌握人類表情的微妙變化。即使如此,F(xiàn)acebook的這款聊天動(dòng)畫機(jī)器人也將聊天機(jī)器人的領(lǐng)域提升到了一個(gè)新高度。而在未來,庫卡機(jī)器人驅(qū)動(dòng)器維修,更加先進(jìn)的機(jī)器人則可創(chuàng)造出真實(shí)的對話模式,其性格可能更復(fù)雜,或能根據(jù)談話對象調(diào)整自己的性格。