簡(jiǎn)析AI:深度學(xué)習(xí)讓AI正在變得像人類(lèi)一樣神秘
從20世紀(jì)60年代開(kāi)始,人們就在期待像哈爾(HAL)這樣的科幻級(jí)別的AI,然而直到最近,PC和機(jī)器人還是非常愚笨,F(xiàn)在,科技巨頭和創(chuàng)業(yè)公司宣告了AI革命的到來(lái):無(wú)人駕駛汽車(chē)、機(jī)器人醫(yī)生、機(jī)器投資者等等。普華永道認(rèn)為,到2030年,AI將會(huì)向世界經(jīng)濟(jì)貢獻(xiàn)15.7萬(wàn)億美元。AI是2017年的熱詞,就像。com是1999年的時(shí)髦用語(yǔ)那樣,每一個(gè)人都宣稱(chēng)自己對(duì)AI感興趣。不要被有關(guān)AI的炒作所迷惑,它是泡沫還是真實(shí)?和舊有的AI潮流相比,它現(xiàn)在有什么新穎之處?
AI并不會(huì)輕易或迅速地被應(yīng)用。最令人興奮的AI實(shí)例往往來(lái)自大學(xué)或者科技巨頭。任何許諾用最新的AI技術(shù)讓公司發(fā)生革命性變革的自封的AI專(zhuān)家,都只是在傳遞錯(cuò)誤的AI信息,其中某些人只是重塑舊有技術(shù)的形象,把它們包裝成AI。每個(gè)人都已經(jīng)通過(guò)使用Google、微軟、亞馬遜的服務(wù),來(lái)體驗(yàn)了最新的AI技術(shù)。但是,深度學(xué)習(xí)不會(huì)迅速地被大企業(yè)所掌握,用來(lái)定制內(nèi)部項(xiàng)目。大多數(shù)人都缺乏足夠的相關(guān)數(shù)字?jǐn)?shù)據(jù),不足以可靠地用來(lái)訓(xùn)練AI。結(jié)果就是,AI并不會(huì)殺死所有的工作機(jī)會(huì),尤其因?yàn)樗谟?xùn)練和測(cè)試每個(gè)AI的時(shí)候還是需要人類(lèi)。
AI目前已經(jīng)能夠用眼睛看到,并精通一些視覺(jué)相關(guān)的工作了,比如:通過(guò)醫(yī)學(xué)影像識(shí)別癌癥或其他疾病,在統(tǒng)計(jì)學(xué)上優(yōu)于人類(lèi)放射科醫(yī)師、眼科醫(yī)師、皮膚科醫(yī)師等,還有駕駛汽車(chē)、讀唇語(yǔ)。AI能通過(guò)學(xué)習(xí)樣本(比如畢加索或者你的畫(huà)作)畫(huà)出任何一種風(fēng)格的圖畫(huà)。反過(guò)來(lái),它也能通過(guò)一幅畫(huà),補(bǔ)足缺失的信息,猜出真實(shí)的照片是什么。AI看著網(wǎng)頁(yè)或應(yīng)用的屏幕截圖,就能寫(xiě)出代碼制作出類(lèi)似的網(wǎng)頁(yè)或應(yīng)用。
AI目前還能用耳朵聽(tīng)到,它不只能聽(tīng)懂你的話,還能通過(guò)聽(tīng)Beatles或你的音樂(lè),創(chuàng)作出新的音樂(lè),或者模擬它聽(tīng)到的任何人的聲音。一般人無(wú)法分辨出一幅畫(huà)或一首曲子是由人還是由機(jī)器創(chuàng)作的,也無(wú)法分辨出一段話是由人類(lèi)還是AI說(shuō)出的。
被訓(xùn)練用來(lái)贏得撲克比賽的AI學(xué)會(huì)了虛張聲勢(shì),能夠處理丟牌、潛在的造假行為,還能誤導(dǎo)信息。被訓(xùn)練用來(lái)談判的機(jī)器人也學(xué)會(huì)了欺騙,能猜測(cè)出你什么時(shí)候在說(shuō)謊,如果需要它們也會(huì)撒謊。一個(gè)用來(lái)在日語(yǔ)和英語(yǔ)間翻譯或者在韓語(yǔ)和英語(yǔ)間翻譯的AI,也能在韓語(yǔ)和日語(yǔ)間進(jìn)行翻譯轉(zhuǎn)換?雌饋(lái)翻譯AI自己創(chuàng)造了一種中間語(yǔ)言,能不分語(yǔ)言的界限演繹任何一個(gè)句子。
機(jī)器學(xué)習(xí)(ML)是AI的一個(gè)子類(lèi)別,KUKA機(jī)器人電路板維修,它能讓機(jī)器從經(jīng)驗(yàn)中學(xué)習(xí),從真實(shí)世界的實(shí)例中學(xué)習(xí),數(shù)據(jù)量越大,它就能學(xué)到越多。據(jù)說(shuō),如果一臺(tái)機(jī)器完成一項(xiàng)任務(wù)的表現(xiàn)隨著經(jīng)驗(yàn)的增多越來(lái)越好,那它就能根據(jù)這項(xiàng)任務(wù)的經(jīng)驗(yàn)進(jìn)行學(xué)習(xí)。但大部分AI還是根據(jù)固定規(guī)則制造出來(lái)的,它們并不能學(xué)習(xí)。從現(xiàn)在開(kāi)始,我將使用機(jī)器學(xué)習(xí)這個(gè)詞來(lái)指稱(chēng)從數(shù)據(jù)中進(jìn)行學(xué)習(xí)的AI,以此強(qiáng)調(diào)它和其他AI的區(qū)別。
人工神經(jīng)網(wǎng)絡(luò)只是通往機(jī)器學(xué)習(xí)的其中一種方式,其他路徑還包括決策樹(shù)、支持向量機(jī)等。深度學(xué)習(xí)是一種具有許多抽象層次的人工神經(jīng)網(wǎng)絡(luò)。不去談深度這個(gè)有炒作意味的詞,很多機(jī)器學(xué)習(xí)方法都是淺顯的。成功的機(jī)器學(xué)習(xí)通常是混合的,也就是很多方法的組合,比如樹(shù)+深度學(xué)習(xí)+其他,它們都是被分別訓(xùn)練而成的,再把它們結(jié)合在一起。每一個(gè)方法都可能帶來(lái)不同的錯(cuò)誤,所以,平均了它們每一個(gè)方法成功的結(jié)果,它們就勝過(guò)了單獨(dú)一種方法。
舊有的AI并不能學(xué)習(xí)。它是基于規(guī)則的,它只是幾個(gè)人類(lèi)寫(xiě)成的如果那么。它只要能解決問(wèn)題就被稱(chēng)作是AI,但它不是機(jī)器學(xué)習(xí),因?yàn)樗荒軓臄?shù)據(jù)中進(jìn)行學(xué)習(xí)。目前的AI和自動(dòng)系統(tǒng)中大部分依然是基于規(guī)則的代碼。機(jī)器學(xué)習(xí)從20世紀(jì)60年代開(kāi)始才被人了解,但就像人類(lèi)大腦一樣,它需要大量的計(jì)算設(shè)備處理大量的數(shù)據(jù)。在20世紀(jì)80年代,要在PC上訓(xùn)練一個(gè)ML需要幾個(gè)月時(shí)間,而那時(shí)候的數(shù)字?jǐn)?shù)據(jù)也非常稀少。手動(dòng)輸入的基于規(guī)則的代碼能快速地解決大部分問(wèn)題,所以機(jī)器學(xué)習(xí)就被遺忘了。但用我們現(xiàn)在的硬件,你能在幾分鐘內(nèi)就訓(xùn)練出一個(gè)ML,我們知道最佳的參數(shù),而且數(shù)字?jǐn)?shù)據(jù)也更多了。然后在2010年之后,一個(gè)又一個(gè)AI領(lǐng)域開(kāi)始被機(jī)器學(xué)習(xí)所掌控,從視覺(jué)、語(yǔ)音、語(yǔ)言翻譯到玩游戲,機(jī)器學(xué)習(xí)勝過(guò)了基于規(guī)則的AI,而且通常也能勝過(guò)人類(lèi)。
為什么AI在1997年的國(guó)際象棋比賽中就擊敗了人類(lèi),但直到2016年,才在圍棋比賽中擊敗了人類(lèi)呢?因?yàn)樵?997年,計(jì)算機(jī)僅僅簡(jiǎn)單地計(jì)算出了國(guó)際象棋8x8棋盤(pán)中所有的可能性,但圍棋擁有19x19的可能性,計(jì)算機(jī)要計(jì)算出所有可能性需要十億年。這就像要隨機(jī)組合出所有字母,以此得到這樣一整篇文章一樣:這根本不可能。所以,人們已知的唯一的希望在于訓(xùn)練出一個(gè)ML,但是ML是近似的,不是確定的,機(jī)器學(xué)習(xí)是隨機(jī)的,它可以被用于統(tǒng)計(jì)分析的模式,但不能用于準(zhǔn)確的預(yù)測(cè)。
機(jī)器學(xué)習(xí)讓自動(dòng)化成為可能,只要你準(zhǔn)備好訓(xùn)練ML的正確數(shù)據(jù)就可以了。
大多數(shù)機(jī)器學(xué)習(xí)都屬于監(jiān)督學(xué)習(xí),這里用來(lái)訓(xùn)練的實(shí)例都是有標(biāo)簽的,標(biāo)簽就是關(guān)于每個(gè)實(shí)例的描述或者標(biāo)注。你首先需要人工把那些關(guān)于貓的照片從關(guān)于狗的照片中分離出來(lái),或者把垃圾郵件從正常郵件中分離出來(lái)。如果你錯(cuò)誤地給數(shù)據(jù)打了標(biāo)簽,最后ML就會(huì)不正確,這至關(guān)重要。把未打標(biāo)簽的數(shù)據(jù)放到ML里,這就是無(wú)監(jiān)督學(xué)習(xí),在這里ML會(huì)發(fā)現(xiàn)有用的數(shù)據(jù)的模型和群組,但它不能單獨(dú)用來(lái)解決很多問(wèn)題。所以有些ML是半監(jiān)督式的。
在異常檢測(cè)中,你可以識(shí)別出不同尋常的東西,你可以讓ML對(duì)任何可疑的不同之處做出警告。政府部門(mén)已經(jīng)開(kāi)始用ML來(lái)偵查逃稅行為了。
強(qiáng)化學(xué)習(xí)在1983年的電影《戰(zhàn)爭(zhēng)游戲》中就已經(jīng)有了體現(xiàn),在電影里,計(jì)算機(jī)通過(guò)打通光速中的每一個(gè)場(chǎng)景,從而避免了第三次世界大戰(zhàn)。這個(gè)AI在百萬(wàn)計(jì)的失敗與嘗試中探索,最終得到了巨大的回報(bào)。AlphaGo是這樣被訓(xùn)練而成的:它曾數(shù)百萬(wàn)次地扮演自己的對(duì)手,從而獲得超越人類(lèi)的技能。它使出了前所未見(jiàn)的招數(shù),人類(lèi)選手甚至可能會(huì)把它看做錯(cuò)誤的招數(shù)。但后來(lái),這些招數(shù)被公認(rèn)為機(jī)智非凡。ML開(kāi)始變得比人類(lèi)圍棋選手更富有創(chuàng)造性。
在人們認(rèn)為AI不是真正智能的時(shí)候,AI效應(yīng)就出現(xiàn)了。人們?cè)跐撘庾R(shí)里需要相信魔力,需要相信人類(lèi)在宇宙中的獨(dú)一無(wú)二。每一次機(jī)器在某一項(xiàng)智能活動(dòng)中超越了人類(lèi)時(shí),比如在下象棋、識(shí)別圖片或者翻譯時(shí),人們總是會(huì)說(shuō):那只是強(qiáng)力計(jì)算能力,那不是智能。很多app里都有AI存在,然而一旦被廣泛應(yīng)用,它就不再被稱(chēng)作智能。如果智能只是AI沒(méi)有達(dá)成的技能(也就是獨(dú)屬于大腦的技能),那字典每一年都要被更新,比如:數(shù)學(xué)在20世紀(jì)50年代之前才被認(rèn)為是智力活動(dòng),現(xiàn)在已經(jīng)不是了。這真是太奇怪了。關(guān)于強(qiáng)力計(jì)算能力,一個(gè)人類(lèi)大腦擁有100萬(wàn)億個(gè)神經(jīng)元連接,比地球上任何一個(gè)計(jì)算機(jī)所擁有的都多得多。機(jī)器學(xué)習(xí)不能做強(qiáng)力計(jì)算,如果讓機(jī)器學(xué)習(xí)去嘗試所有連接,那需要花上十億年的時(shí)間。機(jī)器學(xué)習(xí)只會(huì)在被訓(xùn)練的基礎(chǔ)上進(jìn)行猜測(cè),并且它使用的計(jì)算能力比大腦使用的要少。所以,應(yīng)該是AI來(lái)宣稱(chēng)人類(lèi)大腦不夠智能,來(lái)宣稱(chēng)人類(lèi)大腦只是強(qiáng)力計(jì)算能力而已。