不止Googlevs.Nvidia:深度學(xué)習(xí)引領(lǐng)AI芯片大戰(zhàn)
AI前線導(dǎo)讀:2017年,AI芯片是半導(dǎo)體產(chǎn)業(yè)的亮點(diǎn),而它受到的關(guān)注又遠(yuǎn)遠(yuǎn)超出半導(dǎo)體的圈子。這一年,從科技巨頭到初創(chuàng)公司,新老角色輪番登場(chǎng),為我們上演了精彩好戲。若干年后,當(dāng)我們?cè)倩仡^來看,一定可以把2017年作為AI芯片元年。
GoolevsNvidia巨頭之間的錯(cuò)位戰(zhàn)爭(zhēng)
四月初,Google公布了一篇即將在ISCA2017上發(fā)表的論文:In-DatacenterPerformanceAnalysisofaTensorProcessingUnit�?梢哉f正是這件小事,揭開了一部年度大戲的序幕,而它產(chǎn)生的深遠(yuǎn)影響甚至可能會(huì)持續(xù)到很多年之后。其實(shí),在2016年6月的時(shí)候Google就透露了自己研發(fā)了一款在云端使用的專用AI芯片,TPU(TensorProcessingUnit)。Google做AI芯片當(dāng)然是吸引眼球的新聞,但苦于一直沒有公布細(xì)節(jié),大家也只能猜測(cè)和等待。因此,這篇普通的學(xué)術(shù)論文,得到了媒體的極大關(guān)注。我也在第一時(shí)間寫了一篇評(píng)論文章:GoogleTPU揭秘,也是我的公眾號(hào)閱讀量最大的文章之一。對(duì)TPU高度關(guān)注的當(dāng)然不只我們這些吃瓜群眾,還有AI芯片領(lǐng)域絕對(duì)的統(tǒng)治者Nvidia。后面就發(fā)生了黃教主和Google間關(guān)于TPU的Benchmark結(jié)果是否合理的口水戰(zhàn)。而早在2016年Google透露TPU的時(shí)候,Nvidia就多次表示它對(duì)GPU在AI運(yùn)算上的統(tǒng)治地位沒有什么威脅。
5月11日,www.whsntf.cn,NvidiaGTC2017大會(huì),黃教主在Keynote上拋出了最新的GPUVolta(GV100)。Nvidia股票應(yīng)聲大漲,媒體也是大肆報(bào)道。AI芯片的焦點(diǎn)似乎又回到了Nvidia這一邊。
除了公布了重量級(jí)的Volta,GTC上還有一個(gè)小事件,Nvidia宣布開源它的DeepLearningAccelerator(DLA),9月正式公開。這個(gè)發(fā)布,在黃教主的Keynote中是一句話帶過,但在業(yè)界引起的震動(dòng)卻一點(diǎn)也不小。Nvidia為什么要搞開源?會(huì)開源什么東西?這個(gè)開源會(huì)不會(huì)影響眾多初創(chuàng)公司的前景?對(duì)這些問題的討論一直延續(xù)到NVDLA真正開源之后。
沒過多久,5月17日,在GoogleI/O大會(huì)上,Google公布了第二代TPU,用媒體的話說stoleNvidia’srecentVoltaGPUthunder。雖然TPU2的細(xì)節(jié)公布的并不多,但指標(biāo)確實(shí)看起來很不錯(cuò),而且具有非常好的可擴(kuò)展性。唯一的遺憾就是它并不對(duì)外銷售,只能以TPUCloud的方式供大家使用。
9月下旬,JeffDean這位Google的軟件大神參加了HotChip這個(gè)芯片界的重要會(huì)議,并在KeynoteRecentAdvancesinArtificialIntelligenceviaMachineLearningandtheImplicationsforComputerSystemDesign也親自介紹了TPU和TPU2的情況,把它們作為新的計(jì)算生態(tài)中重要的一環(huán)。
9月底,NVDLA在承諾的最后期限之前開源了NVDLA的部分硬件代碼,同時(shí)公布了未來開源更多硬件和軟件的路線圖。這之后,大家對(duì)NVDLA也做了各種分析和討論,試圖把它玩起來。從目前來看,NVDLA的開源好像并沒有影響眾多初創(chuàng)公司的融資。這個(gè)話題我們后面再說。至于Nvidia開源DLA的原因,官方的說法是讓更多人可以更容易的實(shí)現(xiàn)Inference,促進(jìn)AI的推廣,特別是在眾多嵌入式設(shè)備上的應(yīng)用。但從整個(gè)開源的過程來看,這個(gè)開源的決定似乎是比較倉促的。DLA來自Nvidia自動(dòng)駕駛SoC中的一個(gè)module,最初并不是以開源IP為目的而設(shè)計(jì)的。而且9月的開源也只公開了一部分硬件代碼和相應(yīng)的驗(yàn)證環(huán)境,離真正能用起來也還是有較大差距。我們不好判斷這個(gè)開源的決定是否和GoogleTPU(在Inference上有比較大的優(yōu)勢(shì))的強(qiáng)勢(shì)亮相有關(guān)系。但基本的推測(cè)是,在DeepLearning中Nvidia的核心利益應(yīng)該在于Training(目前GPU還是training的最好平臺(tái))。讓Inference門檻更低,滲透到更多應(yīng)用,特別是Edge端,從而進(jìn)一步促進(jìn)Training的需求,應(yīng)該是符合它的最大利益的。而且NVDLA的軟件環(huán)境還是使用Nvidia的CUDA/TensorRT,還是由Nvidia掌控的。
這場(chǎng)從一篇論文開始,幾乎貫穿了2017年全年的Google和Nvidia的明爭(zhēng)暗斗,對(duì)業(yè)界的影響可能要遠(yuǎn)遠(yuǎn)超過這兩家公司本身。我之所以把它稱為錯(cuò)位的戰(zhàn)爭(zhēng),是因?yàn)樗l(fā)生在Google這樣的傳統(tǒng)的軟件巨頭和Nvidia這樣的芯片巨頭之間。如果換成IntelvsNvidia,似乎是再正常不過的。Google的參戰(zhàn),也許是開啟了新的時(shí)代。我們可以看到,不僅是TPU,Google在10月又公布了他們?cè)贕ooglePixel2手機(jī)中使用的定制SoCIPU(ImageProcessingUnit)。和Apple越來越多的自己定制芯片一樣,Google這樣的科技巨頭同樣有應(yīng)用(明確知道自己要什么),技術(shù)(對(duì)相關(guān)技術(shù)的多年積累),資源(不缺錢,不缺人)上的優(yōu)勢(shì),定制自己的硬件,甚至芯片會(huì)變得常態(tài)化。同時(shí)我們也看到,GoogleTPU的示范效應(yīng)已經(jīng)顯現(xiàn),更多的科技巨頭加入AI加速硬件的競(jìng)爭(zhēng)。Tesla宣布自己定制自動(dòng)駕駛芯片;Amazon,Microsoft,以及國內(nèi)的BAT,華為都在Cloud中提供專門的FPGA加速的支持;據(jù)稱BigFive中還有在自己開發(fā)芯片的;BAT也都在組建芯片設(shè)計(jì)的團(tuán)隊(duì),等等。雖然大家具體的架構(gòu)和實(shí)現(xiàn)方式不同,但都反映出對(duì)AI專用硬件的極大興趣。相信未來這一趨勢(shì)會(huì)越來越明顯。
同時(shí),傳統(tǒng)的芯片巨頭當(dāng)然不會(huì)坐視這個(gè)巨大的市場(chǎng)被Nvidia主宰或者被Google們瓜分。Intel連續(xù)收購了Nervana(云),Movidius(端),Mobileye(自動(dòng)駕駛),Altera(FPGA),又把AMD的RajaKudori(GPU)招至帳下,甚至還搞了Loihi(nueromorphic),可以說拿了一手好牌;雖然動(dòng)作沒有大家想象的那么快,但后面的發(fā)力還是值得期待的。AMD也在努力追趕,畢竟他們的CPU+GPU有自己絕活,而整個(gè)公司也已經(jīng)逐漸走出了低谷。而且,不管Tesla和AMD合作自動(dòng)駕駛芯片的消息到底是真是假,芯片公司這種輸出芯片設(shè)計(jì)能力的模式也是一種不錯(cuò)(或者無奈)的選擇。
以DeepLearning為代表的新型計(jì)算模式將引領(lǐng)未來芯片的發(fā)展方向,這一觀點(diǎn)基本已經(jīng)是大家的一個(gè)共識(shí)。越來越多的玩家會(huì)關(guān)注能夠支持新型計(jì)算的芯片,其中很多可能之前完全不在半導(dǎo)體這個(gè)圈子,也完全不了解芯片是怎么回事。2017年我們不時(shí)能看到一些對(duì)比CPU,GPU,F(xiàn)PGA和ASIC架構(gòu)的科普文章,甚至有10W+的閱讀量,不難看出大家的熱情。
初創(chuàng)公司長(zhǎng)長(zhǎng)的list
2017的AI芯片大戲中,主角不僅是巨頭,初創(chuàng)公司也都粉墨登場(chǎng),戲份一點(diǎn)兒都不遜色。更重要的,在初創(chuàng)公司的表演中,中國公司不僅毫不怯場(chǎng),而且非常出彩。我從8月份開始在github上維護(hù)一個(gè)AI芯片的列表,既包括大公司的產(chǎn)品,又包括初創(chuàng)公司的情況。到12月,這個(gè)列表中的信息越來越多,世界范圍內(nèi)的初創(chuàng)公司有30多家。而且這個(gè)列表還只包含了公開信息,還有很多公司處在stealth狀態(tài)并沒有收錄。我也聽到一個(gè)說法,在AI芯片領(lǐng)域的初創(chuàng)公司可能超過了100家,在TSMC排隊(duì)投片也有30家。