在模仿人類方面,機(jī)器人已經(jīng)可以做到很多事情,比如搬運物體、模仿人類筆跡、調(diào)酒等,但對于稍微復(fù)雜一點的事情機(jī)器人就會遇到困難,比如在廚房里進(jìn)行烹飪。
在模仿人類的動作時,機(jī)器人經(jīng)常會被人們不經(jīng)意完成的一些小動作所困擾,被分散對主要任務(wù)的注意力,比如挪動糖罐、翻找餐具等。
為了解決這個問題,工業(yè)機(jī)器人維修,華盛頓大學(xué)、斯坦福大學(xué)、伊利諾伊大學(xué)香檳分校、多倫多大學(xué)和英偉達(dá)的研究人員提出了一種“逆規(guī)劃”系統(tǒng),通過一系列以廚房目標(biāo)為條件的視頻演示來評估他們的技術(shù),該團(tuán)隊報告稱,他們的動作推理方法將任務(wù)成功提高了20%以上。
動作推理
動作推理能夠使得機(jī)器人在完全不同的環(huán)境中計劃執(zhí)行、復(fù)制相同的目標(biāo)。但研究人員表示,在一個雜亂的環(huán)境中,比如一個廚房,對象的配置方式可能會使得目標(biāo)變得模糊。
在這種情景下,僅僅識別一個動作是不夠的,因為一個任務(wù)可能需要很多的動作。比如,為了拿起一把廚刀,人類可能會先挪開餐盤,掀起桌布,再從桌布下拿起廚刀。
MIT計算機(jī)科學(xué)與人工智能實驗室就有一個“自主機(jī)器人的任務(wù)和運動規(guī)劃”項目,KUKA機(jī)器人維修,表明“我們的目標(biāo)是設(shè)計算法,使機(jī)器人能夠在人類環(huán)境中操作,同時推理高級任務(wù)動作和低級動作”,例如,讓一個機(jī)器人在家庭廚房中自主做飯。
為了完成這樣的任務(wù),它必須考慮高層次的目標(biāo),比如需要哪些成分;同時還有低層次的目標(biāo),比如如何拿到這些成分。通常,低層次目標(biāo)的可行性會影響高層次目標(biāo),比如拿到一種配料可能需要機(jī)器人打開冰箱門、移開幾樣擋在前面的東西。
對于人類來說,做到這些事情似乎是自然而然的。在已知的宇宙中,人類的大腦是最復(fù)雜的東西之一,擁有數(shù)以十億計的神經(jīng)元,每個神經(jīng)元都和數(shù)千神經(jīng)元相聯(lián)系。科學(xué)家已經(jīng)精確地找到大腦中負(fù)責(zé)特定任務(wù)的不同中心,但在領(lǐng)會神經(jīng)元網(wǎng)絡(luò)如何相互協(xié)作以完成這些任務(wù)方面,仍然缺乏有效的研究手段。
機(jī)器人“學(xué)做飯”
在這個實驗中,研究人員為人工智能系統(tǒng)準(zhǔn)備了一個真實的視頻演示,他們讓它學(xué)習(xí)一個有著24個任務(wù)的烹飪目標(biāo),關(guān)于一個人類廚師準(zhǔn)備倒入配料,這些配料最初被三個物體阻擋,包括一個餅干盒、一個芥末瓶和一個糖盒。
研究人員說,他們的完整模型明確地對演示中的物體進(jìn)行了運動推理,工業(yè)機(jī)器人維修,因此不會盲目地把所有的物體運動都當(dāng)作故意的。
此外,他們注意到,它使模仿學(xué)習(xí)在不同的環(huán)境中成為可能。盡管視頻中的人操作了一個對象(即糖盒),系統(tǒng)還是成功歸納了正確的目標(biāo)。雖然糖盒出現(xiàn)在廚房里,但機(jī)器人意識到它不需要移動它,因為糖盒并沒有擋住所需的配料。
“我們的研究結(jié)果表明,這使得我們能夠顯著地超越之前的方法,即基于運動規(guī)劃或任務(wù)規(guī)劃來推斷目標(biāo),”合著者寫道。
這項研究將有利于人工智能在往通用人工智能發(fā)展的道路上更進(jìn)一步。
此前,美國威斯康星大學(xué)麥迪遜分校的一個研究小組已經(jīng)在機(jī)器人模仿人類敲雞蛋、擰瓶蓋、擺放盤子方面取得了進(jìn)展,市面上也已出現(xiàn)了不少能夠根據(jù)預(yù)設(shè)菜譜做飯的機(jī)器人,還有會研究餡餅食譜的機(jī)器人、能制作飯團(tuán)和壽司的機(jī)器人等。
或許有一天機(jī)器人真的能走入我們的家中,像家人一樣為我們做出各種各樣的美食。