有這樣一個評論描述如今的Prisma有多火,世界一半人在用《PokemonGO》抓精靈,另一半人在用Prisma軟件修圖。
Prisma成功刷屏朋友圈之后,有國內(nèi)圖片處理軟件公司產(chǎn)品負(fù)責(zé)人明確向記者表示,Prisma的爆紅提醒了我們用戶對藝術(shù)類風(fēng)格特效存在巨大需求,公司會考慮開發(fā)類似Prisma的產(chǎn)品。
但與AR手游《PokemonGo》剛上線就遭遇國內(nèi)《城市精靈GO》山寨不同的是,6月上線之后就迅速地從俄羅斯風(fēng)靡至全球的Prisma在模仿、借鑒已經(jīng)足夠普及的中國市場一直等到最近才找到追隨者。8月4日,圖片處理應(yīng)用相機(jī)360在更新后的版本中添加了一個類似Prisma功能的超強(qiáng)馬賽克,稱可以讓照片一秒鐘變油畫。
為什么要等這么久
梅德韋杰夫發(fā)布的圖片
需要耐心的AI修圖
技術(shù)達(dá)人出來發(fā)話了,雖然都是在修圖,Prisma和美圖、PicsArt等軟件在技術(shù)上走的是兩條路。能將一張普通照片變成野獸派勞爾杜飛的靜物畫風(fēng)格,也能演繹現(xiàn)代派大師畢加索的立體主義的Prisma背后是人工智能(ArtificialIntelligence,簡稱AI),Prisma以藝術(shù)的名義用流行的方式把深度學(xué)習(xí)的能力展現(xiàn)給了大眾。
那么,能讓連俄羅斯總理梅德韋杰夫都翻了它的牌子,在Instagram上放了一張使用Prisma過濾的莫斯科風(fēng)景圖,這個由莫斯科年僅25歲的AlexeyMoiseenkov和幾個人的團(tuán)隊(duì)開發(fā)的修圖應(yīng)用到底在技術(shù)上牛在哪里
圖普科技研發(fā)工程師Darwin告訴《第一財(cái)經(jīng)日報(bào)》記者,在處理技術(shù)方面,美圖、PicsArt等圖像編輯軟件提供的主要功能基本上是基于底層的數(shù)字圖像處理技術(shù),如濾波、去噪,或一些稍高級的功能分割、人臉檢測等;而Prisma所做的風(fēng)格轉(zhuǎn)換使用的是完完全全的機(jī)器視覺技術(shù),實(shí)現(xiàn)紋理轉(zhuǎn)換(texturetransfer)。繪畫、吟詩、作曲是人的高級智能的表現(xiàn),Prisma的風(fēng)格轉(zhuǎn)換讓大眾有了機(jī)器可以作畫的錯覺,在效果上更高級、更智能。
Prisma的產(chǎn)品由來是因?yàn)閯?chuàng)始人AlexeyMoiseenkov最初發(fā)現(xiàn)了一種開源的人工智能算法,能將照片變?yōu)榻?jīng)典藝術(shù)作品的風(fēng)格,然而這一處理過程需要幾小時時間。因此,他的團(tuán)隊(duì)開發(fā)了自主版本,能在較短時間內(nèi)返回結(jié)果,適合在移動設(shè)備上使用。
但目前對于大多數(shù)Prisma用戶而言,最大的不滿依然來自于圖片處理的時間太長,一般都需要等待幾十秒才能看到預(yù)覽效果。
而這背后,Prisma的產(chǎn)品特性要求用戶在使用時一定要在有網(wǎng)絡(luò)狀態(tài)較好、網(wǎng)速較快的狀態(tài)下,因?yàn)樾枰诰加載繪畫風(fēng)格圖像以及用戶提供的內(nèi)容圖片需要發(fā)送到遠(yuǎn)程的服務(wù)器上進(jìn)行人工智能計(jì)算后再傳回來;此外,因?yàn)樗械膱D片處理都是在云端完成,所以會有少部分用戶遇到使用人數(shù)過多,服務(wù)器過載的情況。
但在人工智能技術(shù)專家們看來,KUKA機(jī)器人示教器維修,即使Prisma的處理速度的確超出了平常大眾一般可以忍受的App處理時間的上限,但Prisma能達(dá)到這樣的速度其實(shí)已實(shí)屬不易,里面涉及到大量的算法改進(jìn)和性能優(yōu)化。
在Prisma出現(xiàn)之前,也有過一款基于深度學(xué)習(xí)技術(shù)的修圖應(yīng)用deepart.io。deepart.io卻無法取得像Prisma一樣的成功的主要原因是一方面在于其處理一張圖片需要消耗大量的GPU時間,導(dǎo)致了很多服務(wù)器資源開銷,如果用戶愿意承擔(dān)這部分費(fèi)用,處理時間在半小時左右,如果不付費(fèi)的話,需要6個小時左右;而另一方面,deepart主要是由大學(xué)的研究員做的技術(shù)性實(shí)驗(yàn),并不會投入過多的精力,在風(fēng)格圖像類型、品牌推廣和商業(yè)化應(yīng)用上考慮較少。
在圖普科技研發(fā)工程師Darwin看來,使用深度學(xué)習(xí)的方式進(jìn)行風(fēng)格轉(zhuǎn)換在技術(shù)層面上看屬于從0到1的創(chuàng)舉,將這種無與倫比風(fēng)格轉(zhuǎn)換效果工程化、落地化最終展現(xiàn)給大眾從產(chǎn)品層面上看也是從0到1的進(jìn)步,之后越來越好的效果,越來越快的速度只是不斷地在1后面添0,在如今極速發(fā)展的AI技術(shù)面前,相信速度的問題會很快就得以解決。
爆紅過后的困境
即使有AI技術(shù)做背書,業(yè)界對于Prisma的未來依然存在擔(dān)憂。Prisma如此驚人的風(fēng)格轉(zhuǎn)換的效果暫時掩蓋了其產(chǎn)品單薄的缺陷,但當(dāng)熱度退去,Prisma是否會像之前眾多爆款的App一樣稍縱即逝,取決于Prisma之后采取的商業(yè)策略。
在中國市場上,從魔漫相機(jī)、臉萌、足記到現(xiàn)在的Prisma,似乎每過一段時間就會出現(xiàn)一個爆款圖片應(yīng)用產(chǎn)品。然而,這些滿足一部分需求的圖片工具類產(chǎn)品在爆紅之后往往并不能走得特別長遠(yuǎn)。
一位不愿意透露姓名的圖片處理工程師坦言,因?yàn)镻risma是強(qiáng)風(fēng)格的濾鏡,用戶容易產(chǎn)生厭倦心理,未來要考慮的優(yōu)化方向是開發(fā)更多新奇效果,或者做產(chǎn)品定位的轉(zhuǎn)型上。爆發(fā)力超強(qiáng)的產(chǎn)品,都會存在持久力不足的特點(diǎn)。新鮮勁兒過去以后,如何把用戶留住,是重要的課題。
如果沒有考慮清楚這一步,迅速地變現(xiàn)也是個好方法。AlexeyMoiseenkov7月份來到Facebook總部參加了一次FacebookLive的直播的消息也被業(yè)界解讀為Facebook可能有意收購Prisma。
而這背后,被大平臺收購是創(chuàng)意工具類應(yīng)用普遍的發(fā)展思路。在此之前,Snapchat先后以1.5億美元和1億美元收購了可動自拍應(yīng)用Looksery和自定義頭像制作應(yīng)用Bitmoji,而Facebook此前也收購了提供類似于Looksery的臉部識別自拍應(yīng)用MSQRD。
此外,AI技術(shù)背后是Prisma使用的是昂貴的云端服務(wù)器去處理請求,這一方面體現(xiàn)出了其使用的深度學(xué)習(xí)計(jì)算的復(fù)雜度,另一方面更是暴露了其巨大的成本消耗,使用GPU等計(jì)算設(shè)備去處理一張圖片的成本并不低。
值得一提的是,此前有消息稱Facebook可能會將Prisma整合到FacebookLive,以此鼓勵更多用戶嘗試直播。此舉將有助于消除用戶面對鏡頭時的緊張感,因?yàn)镻risma的濾鏡可以掩蓋用戶皮膚和環(huán)境燈光的問題。
盡管Prisma團(tuán)隊(duì)此前表示正在開發(fā)視頻濾鏡功能,但在AI技術(shù)工程師們看來,圖像是一個二維的信號,而視頻多了一個時間的維度,對時間提供的信息的利用決定了視頻的處理在面臨更大計(jì)算量的同時也擁有更多的可用的信息量。
Prisma的視頻濾鏡一方面要處理計(jì)算量的問題,保證快,另一方面也要考慮如何利用好時間的信息,進(jìn)一步提升質(zhì)。用圖片的方式對視頻每一幀進(jìn)行處理是可行的,庫卡機(jī)器人,但由于如今的風(fēng)格轉(zhuǎn)換算法還不是特別的穩(wěn)定,所以用這種處理方式生成的視頻會閃爍和出現(xiàn)假的不連續(xù)性(falsediscontinuities)。在Darwin看來,從圖像的處理到視頻的處理,機(jī)器人維修,其中牽涉到大量算法,并不是一件看起來很容易的事,而他的判斷是最終這項(xiàng)視頻功能可能還是以用云端離線的方式處理短視頻呈現(xiàn)給大眾。
另外的擔(dān)憂是,類似Prisma的視頻濾鏡會增加直播的趣味性。但從產(chǎn)生影響的角度,可能不像對圖片的影響這么大。直播的重點(diǎn)是內(nèi)容和互動,對于大多數(shù)用戶而言,美顏、濾鏡只是輔助性的手段。上述圖片處理工程師解釋道。
而這背后,除了Prisma和未來的視頻濾鏡,AI技術(shù)尤其是深度學(xué)習(xí)僅僅在機(jī)器視覺領(lǐng)域,已經(jīng)在人臉識別、OCR(光學(xué)字符識別)、車輛檢測、圖像檢索等領(lǐng)域得到一定的成功的應(yīng)用。