微軟研究院學(xué)者與中科院植物學(xué)家使用機(jī)器學(xué)習(xí)來開發(fā)花卉識別系統(tǒng)
你是否遇到過這種情況?外出與小孩散步,TA發(fā)現(xiàn)一朵很漂亮的花,跑過來問你是什么,但是你突然愣住了因?yàn)槟悴⒉恢浪鞘裁椿ā?/p>
目前世界上至少存在250000種花,即便是經(jīng)驗(yàn)豐富的植物學(xué)者也很難全部認(rèn)識它們。如果現(xiàn)在告訴你以后不用尷尬對小孩承認(rèn)你并不知道它是什么花,不久之后你就能在無論什么時(shí)候都能馬上認(rèn)出任何一種花卉或者任何植物的品種,會不會很期待?
鑒于目前圖像識別的強(qiáng)大能力以及使用智能手機(jī)隨手拍照的便利,普通人通過使用工具也能輕松的識別各種花卉。這個(gè)工具叫做智能花卉識別系統(tǒng)(SmartFlowerRecognitionSystem),說起來這個(gè)系統(tǒng)也是在微軟研究院學(xué)者與中國科學(xué)院植物研究所(InstituteofBotany,ChineseAcademyofSciences,KUKA機(jī)器人示教器維修,IBCAS)偶然促成的。
微軟亞洲研究院常務(wù)副院長芮勇在一次研討會上介紹了微軟的圖像識別技術(shù),在場的中國科學(xué)院植物研究所的植物學(xué)家大為高興,因?yàn)橹八麄兏冻隽舜罅颗硎占瘏^(qū)域花卉分布數(shù)據(jù),但效果并不好。植物學(xué)家們馬上意識到微軟亞洲研究院(MSRA)的圖像識別技術(shù)在這方面擁有巨大的潛力,同時(shí)芮勇也發(fā)現(xiàn)他也找到用來提升圖像識別在解決真實(shí)問題方面的最佳試驗(yàn)工具。
這項(xiàng)合作幫助中國科學(xué)院植物研究所加速累積了260萬的圖像數(shù)據(jù),鑒于全世界任何人都能將任意花卉圖片上傳到這個(gè)數(shù)據(jù)庫中,且沒有人能對這個(gè)上傳進(jìn)行監(jiān)督分類,庫卡機(jī)器人,微軟亞洲研究院團(tuán)隊(duì)必須創(chuàng)造一個(gè)算法來過濾掉不合格的圖片。但這還只是研究員JianlongFu和他的團(tuán)隊(duì)建立這個(gè)能夠在許多不同種類的花卉中識別微小差異的工具中所面臨的第一個(gè)問題。
為了實(shí)現(xiàn)這個(gè)目標(biāo)他們訓(xùn)練了超過20層的卷積神經(jīng)網(wǎng)絡(luò),用來識別使用了一系列可以學(xué)習(xí)的過濾器的圖像。概括來說,它的工作方式是這樣的:
在向前傳導(dǎo)的過程中,每個(gè)過濾器對于輸入容量的寬度和高度來說都是卷曲的,且在過濾器和輸入中間計(jì)算點(diǎn)積。對于過濾器來說這樣產(chǎn)生了一個(gè)二維的激活圖,結(jié)果是神經(jīng)網(wǎng)絡(luò)學(xué)會了在輸入?yún)^(qū)給定空間位置激活每一種特定特性種類的過濾器。
在輸入80萬張圖片到Caffe深度學(xué)習(xí)框架中后,微軟亞洲研究院(MSRA)的研究人員逐漸讓機(jī)器實(shí)現(xiàn)了在圖片識別上超過90%的的準(zhǔn)確率,這個(gè)令人震驚的結(jié)果遠(yuǎn)遠(yuǎn)超過人類的識別正確率。
Caffe框架簡介:
Caffe由加州大學(xué)伯克利的PHD賈揚(yáng)清開發(fā),全稱ConvolutionalArchitectureforFastFeatureEmbedding,是一個(gè)清晰而高效的開源深度學(xué)習(xí)框架,目前由伯克利視覺學(xué)中心(BerkeleyVisionandLearningCenter,BVLC)進(jìn)行維護(hù)。賈揚(yáng)清曾就職于MSRA、NEC、GoogleBrain,他也是TensorFlow的作者之一,目前任職于FacebookFAIR實(shí)驗(yàn)室。
同時(shí)這個(gè)計(jì)劃也大大幫助了中科院的植物學(xué)家們接近他們的目標(biāo),中科院植物所的ZhepingXu說到這個(gè)花卉識別系統(tǒng)不僅讓業(yè)內(nèi)專家有效地掌握中國植物分布的情況,還幫助對花卉非常有興趣的普通人學(xué)到更多的知識。
一張圖片經(jīng)過神經(jīng)網(wǎng)絡(luò)層層分析之后,機(jī)器學(xué)習(xí)能夠識別出其為雛菊。
從目前公布的結(jié)果來看,智能花卉識別系統(tǒng)(SmartFlowerRecognitionSystem)的識別準(zhǔn)確率還是非常不錯的。據(jù)微軟公布的消息,不久之后開發(fā)者將基于這個(gè)花卉識別系統(tǒng)開服出相關(guān)的應(yīng)用,植物學(xué)家們能更加深入他們的研究,家長們在面臨孩子類似的問題前能不再尷尬,與此同時(shí)普通人也能更深入得欣賞花卉的美。
聽起來似乎很不錯,但是這個(gè)智能花卉識別系統(tǒng)(SmartFlowerRecognitionSystem)不免讓人想起之前微軟推出后火遍全球的how-old.net(測測你的年齡)。
How-old.net是微軟在Azure上用新發(fā)布的人臉識別APIs為2015年微軟開發(fā)者大會的展示搭建的,借助人臉識別API這個(gè)網(wǎng)站可以分析用戶上傳的照片中人物的性別和年齡。How-old.net它使用了包括機(jī)器學(xué)習(xí)在內(nèi)的各種最新技術(shù),具體實(shí)現(xiàn)過程如下:
檢測:檢測圖片中人臉的位置
圖像對準(zhǔn):確定一些關(guān)鍵的點(diǎn)的位置,比如眉毛、睛、子、角等,確定這些點(diǎn)之后可以確定人臉區(qū)域。
特征提。河辛藞D像區(qū)域之后,開始提取形狀、紋理、幾何信息是比較關(guān)鍵的特征。
訓(xùn)練:有了大量特征數(shù)據(jù)以及對應(yīng)的年齡數(shù)據(jù),建立一個(gè)模型開始訓(xùn)練。
估計(jì)年齡:新來一張圖片,獲取特征,根據(jù)訓(xùn)練獲取的訓(xùn)練參數(shù),估計(jì)年齡。
How-old.net主要是靠三個(gè)技術(shù)來完成的,它們分別是人臉檢測、性別分類和年齡檢測。其中人臉檢測是其他兩個(gè)技術(shù)的基礎(chǔ),而年齡檢測和性別檢測,它們只是在機(jī)器學(xué)習(xí)的過程中解決了分類的問題。這個(gè)涉及到人臉特征的畫像、收集可學(xué)習(xí)的數(shù)據(jù),建立一個(gè)分類模型以及模型優(yōu)化。How-old.net的人臉定位功能及性別識別功能大致準(zhǔn)確,然而年齡預(yù)測結(jié)果并不是每次都準(zhǔn)確,如下圖中加拿大流行歌手JustinBieber的實(shí)際年齡只有22歲(和選取的圖片也有部分關(guān)系)。
林志穎與郭德綱同齡,吳奇隆比他倆都大,庫卡機(jī)器人驅(qū)動器維修,但是測出來的結(jié)果卻是
使用機(jī)器學(xué)習(xí)的How-old.net雖然大部分測試結(jié)果都是準(zhǔn)確的,但是也存在各種識別出錯的情況(也是How-old.net爆紅的因素之一)。號稱能達(dá)到90%的的準(zhǔn)確率,同樣使用機(jī)器學(xué)習(xí)的智能花卉識別系統(tǒng)(SmartFlowerRecognitionSystem)是否會出現(xiàn)類似的錯誤,這也是不由得令人好奇。