【新智元導(dǎo)讀】機器學習專家、著名的計算機科學和統(tǒng)計學家 Michael I. Jordan 近日在《哈佛數(shù)據(jù)科學評論》上發(fā)表文章,評論當前的人工智能炒作,認為現(xiàn)在被稱為 AI 的許多領(lǐng)域,實際上是機器學習,而真正的 AI 革命尚未到來。
人工智能(AI)已經(jīng)成為當今時代的口號。
技術(shù)專家、學者、記者、風險投資家都在說這個詞。跟其他許多從技術(shù)或?qū)W術(shù)領(lǐng)域流入普通大眾的詞語一樣,“AI”這個詞的使用也存在嚴重的誤解。
然而,跟其他領(lǐng)域中公眾不理解科學家在做的事情不一樣,對于“AI”,科學家們經(jīng)常和公眾一樣困惑。
某種程度上,我們這個時代正在看到一種與我們?nèi)祟惖闹悄芟嗥车墓杌悄艿某霈F(xiàn),這既讓所有人感到興奮,讓我們著迷,同時也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
Michael I. Jordan
我們急需發(fā)展構(gòu)建推理和決策系統(tǒng)的原則
我們可以從另一個角度來講述這個時代。有這樣一個故事,其中涉及人類、計算機、數(shù)據(jù)和生死抉擇,但重點不僅僅是硅基智能這類的幻想。
14年前,我的妻子懷孕時,我們做了超聲波檢查。醫(yī)生是一位遺傳學家,她指出胎兒心臟周圍有一些白點。“這些都是唐氏綜合癥的標志,”她說,“現(xiàn)在你的風險已經(jīng)上升到20分之一了。”她告訴我們,可以通過羊膜穿刺術(shù)了解胎兒是否真的有唐氏綜合癥基因畸變,但羊膜穿刺術(shù)存在風險——在穿刺術(shù)過程中胎兒死亡的幾率大約是300分之一。
作為一名統(tǒng)計學家,我決定找出這些數(shù)字的來源。在我的研究中,我發(fā)現(xiàn)十年前英國有人做過一項統(tǒng)計分析,這些反映鈣沉積的白點確實被認為是唐氏綜合癥的預(yù)測因子。我還注意到,我們做檢查時使用的成像機每平方英寸的像素比英國研究中使用的成像機多幾百個像素。我回去告訴遺傳學家,我相信那些白點很可能是假陽性,也就是字面上的白噪音。
她說:“啊,這就解釋了為什么我們幾年前開始發(fā)現(xiàn)唐氏綜合癥的診斷有上升趨勢。那恰好是新機器運來的時候。”
我們沒有做羊膜穿刺術(shù),幾個月后妻子生下一個健康的女孩。但這件事一直讓我放不下,尤其是我知道由于一次粗略的計算,那天可能有成千上萬的人得到同樣診斷,然后許多人選擇做羊膜穿刺術(shù),造成許多嬰兒不必要的死亡。
這件事揭示的問題不是我個人的醫(yī)療問題;它關(guān)乎一個醫(yī)療系統(tǒng),在不同的地點和時間測量變量和結(jié)果,進行統(tǒng)計分析,并在其他情況下使用結(jié)果。
這個問題不僅與數(shù)據(jù)分析本身有關(guān),而且與數(shù)據(jù)庫研究人員所稱的“溯源”(provenance)有關(guān)——數(shù)據(jù)來自哪里,從數(shù)據(jù)中得出了什么推論,這些推論與當前的情況有多大關(guān)系?雖然專業(yè)人士可能在遇到個案時能逐步解決這些問題,但問題是設(shè)計一個行星級規(guī)模的醫(yī)療系統(tǒng),該系統(tǒng)要能在不需要如此詳細的人類監(jiān)督的情況下做到這一點。
我也是一名計算機科學家,我突然想到,在我所受的教育中,根本找不到構(gòu)建這種行星級規(guī)模的推理和決策系統(tǒng)所需要的原則,這些原則融合了計算機科學和統(tǒng)計學,并考慮到人類的效用。在我看來,發(fā)展這些原則至少與構(gòu)建玩游戲之類眼花繚亂的AI系統(tǒng)同樣重要,這些原則不僅在醫(yī)學領(lǐng)域,而且在商業(yè)、交通和教育等領(lǐng)域都需要。
一個新的工程學分支:將人類和計算機結(jié)合起來
無論我們是否很快就能理解“智能”,我們都面臨著一項重大挑戰(zhàn),那就是如何將計算機和人類結(jié)合起來,從而增強人類的生活。
盡管一些人認為這一挑戰(zhàn)只是AI創(chuàng)造的一種輔助,但另一種觀點認為,這是一個新的工程學分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是圍繞一些關(guān)鍵思想,為人們帶來新的資源和能力,并確保安全。土木工程和化學工程建立在物理和化學的基礎(chǔ)上,而這門新的工程學科將建立在上個世紀賦予了實質(zhì)的思想之上,如信息、算法、數(shù)據(jù)、不確定性、計算、推理和優(yōu)化。此外,由于新學科的大部分重點將放在來自人類和關(guān)于人類的數(shù)據(jù)上,因此,它的發(fā)展將需要社會科學和人文學科的觀點。
雖然各種構(gòu)建塊已經(jīng)就位,但是將它們組合在一起的原則還沒有到位,因此目前將這些塊組合在一起的方式是臨時的。因此,就像人類在土木工程出現(xiàn)之前建造建筑物和橋梁一樣,人類也在繼續(xù)建造涉及機器、人類和環(huán)境的社會規(guī)模的推理和決策系統(tǒng)。正如早期的建筑和橋梁有時會以無法預(yù)見的方式倒塌,并帶來悲劇性的后果一樣,我們早期的許多社會規(guī)模的推理和決策系統(tǒng)已經(jīng)暴露出嚴重的概念缺陷。
不幸的是,我們并不擅長預(yù)測下一個可能出現(xiàn)的嚴重缺陷是什么。我們?nèi)鄙俚氖且粋分析和設(shè)計原則的工程學科。
目前大多數(shù)AI,實際上是機器學習
目前關(guān)于這些問題的公開討論中,經(jīng)常使用“AI”這個術(shù)語作為一個智能的通用詞,這使得人們很難推斷出新興技術(shù)的范圍和后果。因此,我們有必要深入了解AI在最近和曾經(jīng)被用來指代什么。
如今大多數(shù)被稱為AI的東西,尤其是在公共領(lǐng)域,實際上是機器學習(ML),這個術(shù)語在過去幾十年里一直在使用。ML是一個算法領(lǐng)域,融合了統(tǒng)計學、計算機科學和許多其他學科的思想(見下文),設(shè)計處理數(shù)據(jù)、做出預(yù)測和幫助做出決策的算法。
就對現(xiàn)實世界的影響而言,ML是真實存在的,而不僅是最近才火起來的。事實上,在20世紀90年代初期,ML就已展現(xiàn)出將為產(chǎn)業(yè)界帶來巨大改變的苗頭。到了世紀之交,亞馬遜等具有前瞻性的公司就已經(jīng)在他們的業(yè)務(wù)中使用機器學習、解決關(guān)鍵任務(wù)、后端檢測和供應(yīng)鏈預(yù)測中存在的問題,以及建立面向消費者的創(chuàng)新服務(wù),如推薦系統(tǒng)。
在隨后的20年里,隨著數(shù)據(jù)集和計算資源的迅速增長,很明顯,ML很快將不僅為亞馬遜提供動力,而且將為任何一家可以將決策與大規(guī)模數(shù)據(jù)關(guān)聯(lián)在一起的公司提供動力。新的商業(yè)模式將會出現(xiàn)。