機(jī)器人技術(shù)的發(fā)展備受矚目,但不知不覺間,我們已經(jīng)走到了“機(jī)器人2.0”時(shí)代的入口。
“機(jī)器人2.0”伴隨著交互和學(xué)習(xí)能力迭代——從視覺感知、人機(jī)交互,到增強(qiáng)學(xué)習(xí)、連續(xù)學(xué)習(xí),前沿技術(shù)正在開創(chuàng)新的未來機(jī)器人。同時(shí),“機(jī)器人2.0”也在帶來傳統(tǒng)領(lǐng)域、傳統(tǒng)應(yīng)用場(chǎng)景的普遍變革。那么如何解讀這個(gè)“機(jī)器人2.0”大時(shí)代,鳳凰文創(chuàng)專門為您提供來自德國(guó)漢堡科學(xué)院張建偉院士在硅谷的分享。
交互和學(xué)習(xí)能力迭代,把機(jī)器人帶入2.0時(shí)代
今天我們談?wù)摰闹悄苤圃旌蜋C(jī)器人里,有兩個(gè)比較重要的技術(shù),一個(gè)是計(jì)算,另外一個(gè)就是數(shù)據(jù)。傳統(tǒng)的大數(shù)據(jù)公司是在做數(shù)據(jù)的整理、數(shù)據(jù)的可視化等等,F(xiàn)在的整個(gè)趨勢(shì)是在第二層:數(shù)據(jù)的發(fā)現(xiàn),以及最上面一層,即真正的數(shù)據(jù)自動(dòng)整合和自動(dòng)決策,另外就是人機(jī)交互的模式。我們看到很多創(chuàng)新公司,現(xiàn)在在擺脫傳統(tǒng)的觸摸屏和顯示設(shè)備,用新的無處不在的顯示和自然的交互模式來改變整個(gè)人機(jī)交互、工廠領(lǐng)域交互的模式。用自然的語言、用自然的手勢(shì)、自然的表情和自然的物理交互,甚至用腦信號(hào),把這些綜合起來,作為未來的人機(jī)界面的技術(shù)。
現(xiàn)在中國(guó)也在做人工智能2.0的路線圖,機(jī)器人2.0也在被談?wù)摚瑱C(jī)器人在慢慢擺脫傳統(tǒng)的被編程、固定執(zhí)行程序的機(jī)器人模式,基于很多交互功能、記憶功能、學(xué)習(xí)功能變成2.0的機(jī)器人。
包括我們現(xiàn)在使用的這種開源操作系統(tǒng),也是給新的機(jī)器人的發(fā)展帶來了新的機(jī)會(huì),現(xiàn)在所有開發(fā)新的機(jī)器人操作系統(tǒng),都使用ROS操作系統(tǒng)。
當(dāng)前機(jī)器人技術(shù)的變化還包括機(jī)器人的模塊化,這次在CES里也看到很多新的機(jī)器人模塊化產(chǎn)品,圖上是我們?cè)谖迥昵耙呀?jīng)有的一些新的專利,把機(jī)器人按照幾個(gè)標(biāo)準(zhǔn)的模塊來生產(chǎn)和開模,讓它實(shí)現(xiàn)各種各樣的構(gòu)型和新的功能。這也是一個(gè)非常新的未來機(jī)器人的概念。
“機(jī)器人2.0”將帶來傳統(tǒng)領(lǐng)域的普遍變革
我們講機(jī)器人和人工智能的下一個(gè)應(yīng)用場(chǎng)景,實(shí)際上除了智能制造之外,還有整個(gè)社會(huì)的應(yīng)用,比方說助老助殘、城市交通問題、環(huán)境問題,這里面都有新的創(chuàng)業(yè)機(jī)會(huì)。還包括在物流領(lǐng)域、家庭領(lǐng)域、醫(yī)院領(lǐng)域的各種應(yīng)用。以及工業(yè)4.0里人機(jī)交互的一些場(chǎng)景。去年在漢堡我們組織了世界最頂級(jí)的世界智能機(jī)器人大會(huì),有很多工業(yè)界還有創(chuàng)新人才參加,KUKA機(jī)器人維修,期間發(fā)現(xiàn)很多最新的智能機(jī)器人技術(shù)已經(jīng)變成了創(chuàng)業(yè)公司和產(chǎn)品。
這里包括物流的各種系統(tǒng)應(yīng)用:通過新的智能機(jī)器人,實(shí)現(xiàn)新的自動(dòng)物流。也包括傳統(tǒng)的工業(yè)機(jī)器人到交互機(jī)器人,再到可以裝配各種各樣柔性控制功能的機(jī)器人,包括用機(jī)器人檢修各種各樣環(huán)境的管道、隧道、橋梁、公路等等,都有創(chuàng)新公司的一些例子。如果機(jī)器人在智能工廠里,它可以實(shí)現(xiàn)很多新的功能,包括應(yīng)對(duì)比較復(fù)雜的環(huán)境、柔性制造、減少成本、提高效率等。
傳感器是下一步智能機(jī)器人最新的關(guān)鍵技術(shù),現(xiàn)在所有智能機(jī)器人的發(fā)展都是在用各種各樣的傳感器來感知環(huán)境,做智能控制和自主決策。視頻上是我們最近結(jié)題的一個(gè)歐盟項(xiàng)目,做的是自主的、有感知的、有操作功能的機(jī)器人,在意大利和瑞典的老人院里每天都在試用,幫著老人做家務(wù)等,除了這種感知功能、交互功能之外,還有很多操作功能。
機(jī)器人在護(hù)理方面的自動(dòng)化也是新的應(yīng)用場(chǎng)景,比如我的學(xué)生最近在深圳創(chuàng)立了醫(yī)療公司,現(xiàn)在已經(jīng)有新產(chǎn)品在逐漸上市,包括幫助護(hù)士查房、解釋情況等等,包括右圖的機(jī)器人,也就是自動(dòng)配藥的這種機(jī)器,里面有很多傳感器和自主決策的系統(tǒng)。
所以從工廠自動(dòng)化,到培育自動(dòng)化,到醫(yī)療自動(dòng)化再到家庭自動(dòng)化,這是一個(gè)非常清晰的過程,從先toB再到toC,機(jī)器人和人工智能的應(yīng)用一步一步升級(jí)。
增強(qiáng)學(xué)習(xí)、連續(xù)學(xué)習(xí)技術(shù)在開創(chuàng)新的未來機(jī)器人
我們說現(xiàn)在的機(jī)器學(xué)習(xí)的發(fā)展,是從機(jī)器的自動(dòng)化,到軟件的自動(dòng)化,發(fā)展到監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí),而現(xiàn)在我們?cè)谘芯窟B續(xù)學(xué)習(xí)技術(shù)——實(shí)際上是基于增強(qiáng)學(xué)習(xí)技術(shù),并把它層次化,一層一層地從最低級(jí)的概念和技術(shù)進(jìn)入到更上層的學(xué)習(xí)。
現(xiàn)在的增強(qiáng)連續(xù)學(xué)習(xí)技術(shù),我們?cè)谝徊揭徊阶龅梅浅6唷,F(xiàn)在除了輸入/輸出的系統(tǒng)可以測(cè)量,更多的是測(cè)量它輸入/輸出以后,對(duì)系統(tǒng)性能的評(píng)價(jià),這里包括對(duì)未來的預(yù)測(cè),和持續(xù)性學(xué)習(xí),現(xiàn)在已經(jīng)逐漸地從學(xué)術(shù)里慢慢地應(yīng)用到自動(dòng)駕駛,應(yīng)用到機(jī)器人,應(yīng)用到智能系統(tǒng)里。
視覺感知技術(shù)的突破將帶來機(jī)器人應(yīng)用的爆發(fā)
還有就是在整個(gè)認(rèn)知方面,視覺感知方面,現(xiàn)在德澤在杭州的一家公司,產(chǎn)品也在逐漸的成型。就是怎么把人類的視覺中樞用大數(shù)據(jù)的方式把新型的傳感器變成視覺信息庫(kù),然后放到云里,用智能算法來進(jìn)行匹配、識(shí)別、定位和導(dǎo)航等等。像現(xiàn)在的谷歌自動(dòng)駕駛還有特斯拉的自動(dòng)感知有很多開放性研究論題。
這圖就是機(jī)器人眼里的各種各樣的定位問題,綠色的是已經(jīng)比較成熟的技術(shù),藍(lán)色的是部分成熟的技術(shù),紅色的是未來的技術(shù),實(shí)際上我們?cè)谝曈X的定位、感知、導(dǎo)航方面,正在面向未來進(jìn)行技術(shù)的開發(fā),F(xiàn)在在導(dǎo)航技術(shù)里,室外的GPS基本上已經(jīng)非常成熟,然后室內(nèi)的一般是用激光的辦法,還是比較昂貴,只能看物體外邊的輪廓,下一個(gè)挑戰(zhàn)是純粹用視覺的技術(shù)來進(jìn)行定位、識(shí)別、導(dǎo)航。現(xiàn)在我們已經(jīng)做出了一些嵌入式的系統(tǒng),在VR、物流、和機(jī)器人本身已經(jīng)得到了應(yīng)用。實(shí)際上在無人駕駛、無人機(jī)、服務(wù)系統(tǒng)和家庭機(jī)器人里,包括宇航飛船,庫(kù)卡機(jī)器人何服電機(jī)維修,未來都會(huì)有很好的應(yīng)用。現(xiàn)在CES里也有得獎(jiǎng)的作品,拿手機(jī)識(shí)別出上千種的物體,現(xiàn)在也逐漸變成了一個(gè)應(yīng)用型技術(shù),在用深度學(xué)習(xí)的技術(shù),進(jìn)行機(jī)器人的日常生活物體的理解。包括在工業(yè)界里,比如在中國(guó)很多汽車工廠,自動(dòng)識(shí)別汽車車體的位置和姿態(tài)。也包括我們用一些新的傳感器和機(jī)器人的技術(shù)進(jìn)行一些道路橋梁和基礎(chǔ)設(shè)施的檢測(cè)。
實(shí)際上機(jī)器人的下一個(gè)挑戰(zhàn)是多模態(tài)的學(xué)習(xí)技術(shù),怎么讓機(jī)器人通過物理的交互,積累經(jīng)驗(yàn),學(xué)到不同的本領(lǐng)。深度學(xué)習(xí)只是我們的五種模式之一,實(shí)際上還有更多的包括腦機(jī)接口技術(shù)、包括行為學(xué)研究、包括神經(jīng)影像,和用新的集成的系統(tǒng)來研究新的人機(jī)交互和智能的算法。包括各種各樣傳感器的融合,視覺聽覺位置觸覺,庫(kù)卡機(jī)器人何服電機(jī)維修,怎么按照人的更好地整合信息的辦法來實(shí)現(xiàn)新的智能系統(tǒng)。
機(jī)器人2.0帶來的是傳統(tǒng)產(chǎn)業(yè)升級(jí)和國(guó)際化創(chuàng)業(yè)機(jī)會(huì)
從機(jī)器人的2.0到人的2.0的項(xiàng)目都會(huì)有非常大的作用,包括在心理健康保健、機(jī)器人和工業(yè)制造里都會(huì)有很大的用途。包括各種服務(wù)系統(tǒng)、未來機(jī)器人、人機(jī)共存的場(chǎng)景控制,包括未來認(rèn)知工廠里的一些應(yīng)用場(chǎng)景。這些項(xiàng)目里,中國(guó)一些比較大的企業(yè),比如華為、京東方,還有英特爾、飛利浦、空客和大眾,以及最近的西門子、庫(kù)卡,對(duì)我們的項(xiàng)目都有一些投入,包括深度學(xué)習(xí)、大數(shù)據(jù)、自動(dòng)駕駛、診斷系統(tǒng)、人機(jī)交互、環(huán)境感知等等,人們都非常感興趣。