深度學習并不是AI的未來
現(xiàn)在,每一個人不是在學習深度學習,就是在準備開始學習深度學習的路上。這個人工智能領域快速火了起來。大約有來自各年齡階段的十萬名學生在學習付費或者免費的深度學習課程。許多初創(chuàng)公司以及產品都打上了該領域的標簽,就像流行用語一樣,但是真正使用了深度學習的卻很少。大多數人忽視了一個事實,深度學習只占了機器學習領域的1%,而機器學習又只是人工智能領域的1%。剩下的99%都是大多數任務已經在實際使用的。一個深度學習領域專家并不是一個人工智能專家。
深度學習并不是人工智能的同義詞
最廣為人知的人工智能工具來自于谷歌、Facebook等公司,大都是或者只是深度學習,所以公眾會認為新的人工智能突破是由或者將由深度學習實現(xiàn)。這是不正確的。像XGBoost這樣的決策樹并不出名,但是在許多Kaggle表格數據競賽中默默地打敗了深度學習。大眾媒體指出AlphaGo只用到了深度學習,但是實際上它是MonteCarlo樹搜索算法+深度學習,并存在證據證明單單靠深度學習不足以讓它獲勝。許多強化學習任務是由NEAT算法(通過增強拓撲的進化神經網絡)實現(xiàn),不是基于BP的神經網絡算法。這些都是人工智能領域有關深度學習的誤解。
我并不是說深度學習沒有在解決問題:深度學習確實很厲害。樹以及其他算法往往很難打敗深度學習,有些任務中深度學習也是無法替代的,我也希望未來能開發(fā)出不含深度學習的系統(tǒng)能打敗深度學習;蛟S也能夠解決深度學習作出的決策存在的法律噩夢(即使是正確的,但是被法律質疑時無法解釋)。同時我想在新聞里讀到像災難性遺忘(出現(xiàn)學習新的信息前突然忘記先前學習的信息的傾向)這樣的有關深度學習的事情,或者讀到解決過擬合問題的一些日常新聞。關于智能:深度學習僅僅相信得到的訓練數據,并不理解對與錯、現(xiàn)實與虛幻、是否公平。在某種程度上,人類有時也會相信假新聞,甚至小孩子也知道電影是虛構的,并不現(xiàn)實。
現(xiàn)在的深度學習也許是曾經的HTML?
20年前每個人都在學習HTML,這種編寫網頁的標記語言,那時每個人都幻想成為一個。com億萬富翁。就像其他人一樣,我學習了每一種看似很有用的技術:HTML、移動端應用、深度學習,我也希望每一個人在其一生中能夠不斷學習新事物。事實上,你不可能一輩子只學一種技術。如果你學習深度學習,你可能一輩子都搞不懂AI。來自1995年的HTML已經過時且無法滿足需求,它被CSS、Javascript以及服務器端編程語言所接管。同理,深度學習總有一天也會過時且不夠用。許多流行的移動端APP都不包含HTML,所以誰知道未來的人工智能APP是否包含深度學習呢?
事實上,庫卡機器人,深度學習是一種源于1980年代的技術,比HTML還悠久:70年代,帶有隱藏層的神經網絡通過訓練更多數據獲得了更好的結果,隨后重命名為深度學習并開始大肆宣傳。在1992年,我仔細檢查了一些神經網絡源碼以及一些分形、元胞自動機之類的東西。就像大多數人,那時的我誤以為深度學習只是一個學術性數學難題,沒有實際用途。相反,我專注于學習給出直接結果的技術:電子游戲的3D技術、互聯(lián)網等等。但是我們都錯了,深度學習能夠利用大數據做很多神奇的事情!2015年我著迷于DeepDream(人工神經網絡),接下來是GANs(生成對抗網絡)等等。當然,深度學習并不是我們發(fā)明的最后的完美的AI科學。
在過去的幾十年里,古老的深度學習已經被廣泛研究和更新并應用于更精確地解決更多任務,不過沒有一個版本的深度學習(Convolutional,RNN,RNN+LSTM,GANs等)能夠解釋它的決策。在未來,深度學習能夠解決更多任務并取代一些工作,但不可能解決所有的問題,或者保持驚人的進步以自我解決黑箱問題。
哲學家柏拉圖與亞里士多德正在說:深度學習可不能理解他們。
未來人工智能應該去探索一些其他的新方法或已存在被忽略的方法。深度學習的限制在于僅僅認為真理是數據中頻繁出現(xiàn)的地方,而統(tǒng)計較少的就是錯的或者頻繁出現(xiàn)地方的對立面。深度學習的公正性并不來自于它本身,而是來自于人類選擇并準備的數據。深度學習不是用人類的方法來閱讀文本并翻譯出字里行間的意思。
難怪深度學習并不能解釋自己的決策,深度學習會學習并模仿有缺陷的邏輯而不是去發(fā)現(xiàn)缺陷,包括恐怖主義。就連小孩都能自己理解電影中誰是壞蛋,但是深度學習不能,除非人類一開始就非常明確地告訴它。深度學習中一些特定的東西,比如基于梯度下降的反向傳播算法、自定義深度學習硬件是很酷的,但是那大多數都是統(tǒng)計學和幾何學,所以將不會出現(xiàn)在2037年的AI領域。
深度學習領域的人工智能或將是非法的
對于大多數任務而言,深度學習領域的人工智能是或將是非法的,不是符合規(guī)則的。收集28個歐盟國家的居民數據的人或公司應該遵循建立于2018年5月25日的《通用數據保護法規(guī)(GDPR)》。在這一天,歐洲的大多數APP將去除深度學習,導致許多人工智能初創(chuàng)公司快速將深度學習替換成其他的東西,否則將面臨罰款。罰款金將高達全球收入的4%,包括在美國的收入。
GDPR要求針對自動決策作出正確的解釋,防止由于種族、意見、健康等等歧視而產生不好的影響。全球范圍內,像GDPR這樣的法律出現(xiàn)或者在計劃內只是時間問題!睹绹叫刨J報告法》要求披露所有影響消費者信用評分的因素,最多允許4個因素。深度學習的影響因素常常有上千或者百萬級,不僅僅只有4個,如何簡化為4個?人工智能,比如比特幣ICO,開始忽視規(guī)則,只不過法律和罰款總會來的。
深度學習系統(tǒng)在辨別小貓照片或者在自拍時添加小兔耳朵特效時都需要更多相關的決策,在未來將被非深度學習系統(tǒng)所替代。人工智能需要可解釋的,與深度學習大大不同,你能用簡單、合法的詞語向法官或者普通使用者解釋結果。深度學習的復雜性,使得它對于法官和用戶來說就是一種魔法,具有法律風險:并不是很酷炫的未來。深度學習會建議或者警示人類,比如從醫(yī)學圖像中檢測疾病,由醫(yī)生核實,但是這只是半自動化,缺少細節(jié)。而對被AI拒絕(拒絕貸款、工作等等)需要解釋用戶說點什么呢?
法律包括了解釋權,比如為什么工作或者貸款被拒絕了。深度學習給出的結果,不是自然(法律)語言能解釋的。你可以得到數頁有關深度學習的變量的內容,但是法官或用戶不能接受,因為即使是最好的數學家或者其他算法也不能將深度學習的模型用詞語簡單解釋。