深度學(xué)習(xí)三巨頭聚首:Hinton堅(jiān)持10年內(nèi)機(jī)器會(huì)掌握常識(shí),Lecun說20年
在昨天的蒙特利爾深度學(xué)習(xí)峰會(huì)上,KUKA機(jī)器人示教器維修,深度學(xué)習(xí)三巨頭Hinton、LeCun、Bengio齊聚首,展望深度學(xué)習(xí)和AI的未來深度學(xué)習(xí)會(huì)一直存在嗎?下一大挑戰(zhàn)是什么?解決了什么問題,三大神會(huì)退休?他們之間在學(xué)術(shù)上還有什么分歧?例如:Hinton有很多論文被拒;LeCun不喜歡概率,把Hinton叫做概率警察;最年輕的Bengio已經(jīng)趕上兩位前輩、此外,三大神還講述了他們相遇的故事,頻頻展露幽默一面,趕緊來看
昨天,在RE?WORK蒙特利爾深度學(xué)習(xí)峰會(huì)上,AI三巨頭GeoffreyHinton、YoshuaBengio和YannLeCun有史以來頭一遭,不僅出現(xiàn)在同一個(gè)活動(dòng)中,而且聚集在同一個(gè)panel里,分享了他們對(duì)前沿研究進(jìn)展的展望,并討論了加拿大人工智能和深度學(xué)習(xí)生態(tài)系統(tǒng)的格局。
來自麥吉爾大學(xué)的JoellePineau主持了這場(chǎng)討論,她以十分有趣的方式開場(chǎng),請(qǐng)三大神介紹站在自己旁邊的人,整個(gè)禮堂立馬充滿了笑聲。
YoshuaBengio率先開了頭,他說:這是Yann,我在讀碩(Master)期間遇到了他,當(dāng)時(shí)他正跟著Geoff一起做博士后,后來Yann請(qǐng)我去和他一起工作,開始研究卷積神經(jīng)網(wǎng)絡(luò),到今天這仍然是個(gè)熱門課題!
接著,YannLeCun介紹GeoffreyHinton,LeCun說:我也來回顧一下歷史,我還是本科生的時(shí)候研究了神經(jīng)網(wǎng)絡(luò),發(fā)現(xiàn)在上世紀(jì)70年代這方面沒有研究發(fā)表。我看到一篇題為《優(yōu)化感知推理》(OptimalPerceptualInference)的文章,Geoff是三位作者之一。我讀了這篇論文,知道我必須見見Geoffery。
最后輪到Hinton,他開玩笑說,他或許是Bengio論文的導(dǎo)師(supervisor),但他實(shí)際上已經(jīng)不記得了。Hinton繼續(xù)說:那是一篇非常好的論文,將神經(jīng)網(wǎng)絡(luò)用于語音識(shí)別。Yoshua和我在加拿大做得很好,因?yàn)榧幽么笾С只A(chǔ)研究。如今領(lǐng)域發(fā)展得非常快,我現(xiàn)在已經(jīng)跟不上Yoshua的節(jié)奏了!每個(gè)星期都有好幾篇arXiv論文出來,Yoshua在attention方面的工作令我印象非常深刻。我感覺Yoshua年紀(jì)是最小的,他還有一些路要走,但不幸的是我認(rèn)為他已經(jīng)追上我們了!現(xiàn)在Yoshua在他的領(lǐng)域里已經(jīng)做出了跟Yann在CNN上同樣大的影響力。
以下是現(xiàn)場(chǎng)討論實(shí)錄:
能談一下現(xiàn)在和上世紀(jì)八九十年代研究深度學(xué)習(xí),在深度學(xué)習(xí)領(lǐng)域工作的區(qū)別嗎?
Bengio:在那時(shí),你可以全身心投入研究,一點(diǎn)干擾也沒有。當(dāng)時(shí)的環(huán)境跟現(xiàn)在完全不同。當(dāng)我們幾個(gè)遇到彼此的時(shí)候,情況跟現(xiàn)在還是有一些類似的,但神經(jīng)網(wǎng)絡(luò)還是邊緣研究,才開始了5到10年的樣子。上世紀(jì)90年代初,神經(jīng)網(wǎng)絡(luò)火過一陣子,企業(yè)也是真的大力投入,有過一些炒作,所以跟現(xiàn)在還是有些類似的。但是,現(xiàn)在神經(jīng)網(wǎng)絡(luò)是真的能用了。
LeCun:我認(rèn)為神經(jīng)網(wǎng)絡(luò)在當(dāng)那時(shí)候也能用啊!但是,60年代研究感知的人認(rèn)為神經(jīng)網(wǎng)絡(luò)不是一個(gè)有價(jià)值的方向,所以他們開始各種改名字改叫法,按他們的方式去做,造成了巨大的實(shí)際影響。
Hinton:他們都太年輕啦,根據(jù)不記得這回事!
LeCun:現(xiàn)在的AI教科書里,還有很多那時(shí)候的東西,上世紀(jì)90年代的神經(jīng)網(wǎng)絡(luò),早就過時(shí)了,但現(xiàn)在還被當(dāng)做參考,它們是有用,但是它們不是通往AI的路徑。很多我們今天使用的技術(shù),也將以同樣的方式廣為傳播,也將以同樣的方式傳給下一代、下下一代,除非我們找到讓這些技術(shù)能夠繼續(xù)有用、往前發(fā)展的下一步,否則現(xiàn)在的很多技術(shù)也將會(huì)死亡。
Hinton:同意Yann的觀點(diǎn)!
在你的眾多論文中,有什么是我們應(yīng)該注意但卻忽略了的嗎?
Hinton:比h-index少一個(gè)引用數(shù)的那篇吧(笑)。我在2008/9年寫了一篇文章,使用矩陣來對(duì)關(guān)系(relationship)和概念(concept)建模。給定3個(gè)東西,你要根據(jù)前兩個(gè)推斷出第3個(gè)。我在2000年初做了很多工作,基本上是早期的嵌入。有人說我該放棄這項(xiàng)工作,因?yàn)檎撐闹兄挥幸粋(gè)非自我引用!我的想法是,不是用向量表示對(duì)象,矩陣表示概念,而是用矩陣來表示這兩者,這樣就能表示關(guān)系的關(guān)系。我們教它3+2等于5,然后教它2和+在一起是+2,系統(tǒng)產(chǎn)生的輸出從來沒有見過+這個(gè)概念,所以它必須學(xué)習(xí)自己。這篇論文得了個(gè)2、2、3的評(píng)分(滿分10分)。后來,我把論文發(fā)給認(rèn)知科學(xué)那邊,他們也不喜歡,說:如果我對(duì)論文的理解是正確的,那這篇論文真是太棒了,但我認(rèn)為我們的讀者不會(huì)對(duì)這個(gè)感興趣!
Bengio:我都沒有提交我的論文,因?yàn)槲抑揽隙〞?huì)被拒!那篇論文的想法是,為了學(xué)習(xí)我們需要其他人的指導(dǎo),這里就不多說了。
隨著時(shí)間的推移,你們幾位取得的共識(shí)似乎越來越多。現(xiàn)在你們被稱為深度學(xué)習(xí)三巨頭,但還有什么是你們彼此之間存有巨大分歧的?
Bengio:這是坑嗎?我不跳哦!
Hinton:政治!但我們對(duì)美國的政治看法都相同。
LeCun:相比問題本身,或許我們對(duì)解決問題的方法有不同的意見。有段時(shí)間,Geoff用概率
Bengio:凡是有關(guān)概率的事情,Yann一點(diǎn)都不想知道,他把Geoff叫做概率警察。
現(xiàn)在有很多人在做深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)會(huì)在AI里一直存在嗎,還是說其他領(lǐng)域會(huì)興起?
Bengio:我們絕對(duì)需要在現(xiàn)有基礎(chǔ)上發(fā)展新的想法。這些想法將受到我們現(xiàn)有技術(shù)和概念的啟發(fā),并將成為創(chuàng)造新東西的基礎(chǔ)。
LeCun:這些概念將被參數(shù)化并且繼續(xù)發(fā)展它們不會(huì)消失,但光是現(xiàn)在這樣顯然是不夠的,所以我們需要考慮新的架構(gòu)很多人都在積極探索動(dòng)態(tài)架構(gòu)(dynamicarchitecture),自然語言處理也有很多有趣的事情發(fā)生。我們還需要更多的訓(xùn)練超大規(guī)模學(xué)習(xí)系統(tǒng)的方法這可能不是最終的答案,KUKA機(jī)器人電路板維修,還可能有舊的想法再次火起來。接下來還會(huì)出現(xiàn)這樣一些方法,那就是將深度學(xué)習(xí)和推理這樣更離散的東西連接起來。
Bengio:我們需要找到方法,讓ML和DL重新拿起目標(biāo)函數(shù),并用新的方法來訓(xùn)練和教育這些目標(biāo)函數(shù),這對(duì)AI來說是至關(guān)重要的。
Hinton:Yann和Yoshua還認(rèn)為最大的困難并不是找到一個(gè)無監(jiān)督學(xué)習(xí)的目標(biāo)函數(shù)。我在92年發(fā)表了一篇將空間一致性作為目標(biāo)函數(shù)的論文。有了這個(gè)以后,我們能夠?qū)W習(xí)更多的層,了解更多的東西。我們還能訓(xùn)練自編碼器。
雖然具體解決時(shí)間我們還不知道,但你們認(rèn)為下一個(gè)挑戰(zhàn)和我們會(huì)解決的下一個(gè)問題是什么?
LeCun:在Facebook,有一個(gè)團(tuán)隊(duì)是做星際爭(zhēng)霸的。這個(gè)游戲比圍棋更難,因?yàn)樗褂脩?zhàn)略,有多個(gè)智能體,各種技術(shù)你不知道你的同伴在做什么,在韓國星際是職業(yè)競(jìng)技的一種,非常具有挑戰(zhàn)性。現(xiàn)在有一些玩星際的bot,但都不在人類的水平。Facebook和DeepMind的團(tuán)隊(duì)正在使用機(jī)器學(xué)習(xí)玩星際,www.whsntf.cn,我認(rèn)為我們會(huì)在這方面看到一些進(jìn)展。但是,下一個(gè)真正改變?nèi)祟惿睿⑶椅覀兛梢越鉀Q的問題,是如何訓(xùn)練一輛汽車自動(dòng)駕駛有沒有辦法做到完全自動(dòng)并且安全?