進(jìn)擊的人工智能:從產(chǎn)品角度,深度解析「對(duì)話機(jī)器人」
今天,擁有對(duì)話能力的機(jī)器人,被逐漸認(rèn)為是一種核心智能,是否能夠流利地完成對(duì)話,可被視作這款機(jī)器人是否真正擁有智能的唯一憑證。
從可以追溯的歷史資料來(lái)看,對(duì)話機(jī)器人(chat-bot)至少在上世紀(jì)六十年代就已經(jīng)問(wèn)世,經(jīng)過(guò)近五六十年的發(fā)展,今天我們已經(jīng)可以在許多產(chǎn)品中看到對(duì)話機(jī)器人的影子,微軟的Cortana、小冰,蘋(píng)果的Siri、GoogleNow、阿里小蜜、百度度秘、圖靈機(jī)器人、助理來(lái)也、出門(mén)問(wèn)問(wèn)等等。
可以肯定的是:對(duì)話機(jī)器人已經(jīng)成為了一種業(yè)界時(shí)尚,越來(lái)越多的公司試圖通過(guò)這種全新的交互形式,來(lái)優(yōu)化或者升級(jí)自己產(chǎn)品我們已經(jīng)可以在許多的產(chǎn)品中看到各種名為小X機(jī)器人的子產(chǎn)品。
如此多的對(duì)話機(jī)器人很容易給人一種百花齊放、方興未艾的感覺(jué)。我們可能會(huì)隱約覺(jué)得:每家的對(duì)話機(jī)器人產(chǎn)品都大同小異,有些家的產(chǎn)品會(huì)有一些別樣的特征,可是終究給人一種不屬于過(guò)去十年移動(dòng)互聯(lián)網(wǎng)發(fā)展的感覺(jué)這些對(duì)話機(jī)器人似乎都還處在很早期,用戶量似乎都不大,顯得都有些小眾。
我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對(duì)話機(jī)器人背后,需求和產(chǎn)品邏輯是怎樣的(文中我無(wú)意去對(duì)比各家對(duì)話機(jī)器人的優(yōu)劣,也不討論某款對(duì)話機(jī)器人的產(chǎn)品觀或方法論)。
一、探索對(duì)話行為背后的需求
首先,我們?cè)噲D探索對(duì)話這一行為的場(chǎng)景與背后的需求。
在《人類(lèi)簡(jiǎn)史》一書(shū)中,認(rèn)為語(yǔ)言能力是智人區(qū)別于其他猿類(lèi)最重要的特質(zhì)和能力;因?yàn)檎Z(yǔ)言能力,智人可以互相通過(guò)對(duì)話而形成更豐富的交互,從而才有了協(xié)作和后來(lái)的文明。
人類(lèi)有三種最直接的方式來(lái)使用語(yǔ)言:一對(duì)零、一對(duì)多、一對(duì)一。
一對(duì)零是自我內(nèi)化的反思、總結(jié)、沉淀,不向外做交互和分享。
一對(duì)多是廣播式的宣講和相對(duì)單向的輸出,譬如開(kāi)大會(huì)或者發(fā)號(hào)施令。
一對(duì)一是對(duì)話群聊也是由許多的一對(duì)一構(gòu)成的,所以我認(rèn)為不存在真正意義上的多對(duì)多對(duì)話。我認(rèn)為對(duì)話是我們?nèi)伺c外界進(jìn)行交互的最直接即時(shí)的途徑(注意即時(shí)很重要)。
所謂對(duì)話,一定是一個(gè)雙方交互行為,并且互為I/O(input/output)的過(guò)程。比如兩個(gè)人對(duì)話,每個(gè)人所說(shuō)的話,對(duì)于自己而言是輸出,對(duì)于對(duì)方而言是輸入。原則上,對(duì)話可以永遠(yuǎn)持續(xù)下去。
但我們幾乎從未見(jiàn)過(guò)兩個(gè)人會(huì)永遠(yuǎn)在對(duì)話,那是因?yàn)椋喝绻枰獙?duì)話持續(xù)下去,雙方都需要保持參與;任何一方覺(jué)得疲勞或者無(wú)價(jià)值感了,對(duì)話就會(huì)終止。
對(duì)話的場(chǎng)景更加貼近我們的生活行為,它頻次最高,且環(huán)境開(kāi)放多變,分析它背后的需求并不容易,F(xiàn)在,我們需要回答兩個(gè)問(wèn)題:
1.1第一個(gè)問(wèn)題:對(duì)話為什么能夠開(kāi)始?
我認(rèn)為人在對(duì)話中存在三個(gè)層面的需求。
第一層,是基礎(chǔ)問(wèn)答的需求?梢悦枋鰹椋
我有一個(gè)問(wèn)題,請(qǐng)你回答我。
二次追問(wèn)的問(wèn)題,屬于新問(wèn)題。這個(gè)過(guò)程,非常類(lèi)似于我們今天所使用的搜索引擎。
第二層,是任務(wù)流程協(xié)作的需求,以達(dá)成某種目的為止。可以描述為:我想請(qǐng)你幫我買(mǎi)一張明天下午14:00-18:00出發(fā),北京到上海的機(jī)票;經(jīng)濟(jì)艙,盡可能便宜,最好是東航的。我們和朋友相約去逛街,拜托同事幫忙預(yù)定會(huì)議室,接受閨蜜的請(qǐng)求明早叫她起床。
這些都是任務(wù)流程協(xié)作的需求。
第三層,是共同的情感建立,無(wú)論喜怒哀樂(lè)。聊天的目標(biāo)很難定量量化,我們更多是嘗試定性地去制定聊天的目標(biāo)?赡苁切那椴缓眯枰伺,也可能是好事情需要向好朋友分享,我們需要對(duì)話來(lái)表達(dá)進(jìn)行最直接即時(shí)的表達(dá)。
我并不認(rèn)為只有孤獨(dú)的情感才需要對(duì)話人作為擁有萬(wàn)年發(fā)展歷程的群居動(dòng)物,與他人進(jìn)行情感分享是早已刻入基因的特質(zhì)。只是我們建立的情感在不同人之間會(huì)有所不同,對(duì)于信任之人的情感建立會(huì)很深刻,而對(duì)于點(diǎn)頭之交則會(huì)保留許多。
開(kāi)啟一段對(duì)話一定源自上述的某種需求,而開(kāi)啟的契機(jī)則是一個(gè)相對(duì)明確的話題,哪怕只是一句我餓了。
1.2第二個(gè)問(wèn)題:對(duì)話為什么會(huì)持續(xù)?
對(duì)話能夠持續(xù),是有兩個(gè)層面的原因。
第一個(gè)原因,是至少一方的需求沒(méi)有得到滿足。比如我去提問(wèn)題,對(duì)方回答我不滿意,我就會(huì)持續(xù)追問(wèn)。兩個(gè)女生在一起聊八卦,聽(tīng)的人很入神,講的人才有成就感能繼續(xù)講下去。
第二個(gè)原因,是雙方相對(duì)平等。如果我提了個(gè)問(wèn)題,或者請(qǐng)對(duì)方幫個(gè)忙,但是對(duì)方始終是一種高姿態(tài)不搭理我,那我就很容易放棄,不想聊了。反過(guò)來(lái),如果對(duì)方對(duì)我過(guò)分尊敬,總在說(shuō)一些沒(méi)有營(yíng)養(yǎng)的恭維拍馬屁的話,時(shí)間久了,我也會(huì)變得更虛榮,而且會(huì)覺(jué)得很無(wú)聊。所以,人不會(huì)和自己階層或者品味相差太多的人聊天,絕大多數(shù)人更不會(huì)和寵物長(zhǎng)時(shí)間聊天。
對(duì)話會(huì)終止,最根本的原因是:雙方都放棄了這輪對(duì)話。
感性一些來(lái)描述對(duì)話終止的原因,可以認(rèn)為是雙方都覺(jué)得疲憊了,也就是這一輪對(duì)話的能耗消耗殆盡;哪怕是情侶之間說(shuō)甜言蜜語(yǔ),聊個(gè)兩三千句也會(huì)覺(jué)得累了,也會(huì)在十幾個(gè)回合的互道晚安中結(jié)束本次對(duì)話。
所以,對(duì)話總會(huì)終止,能耗殆盡就會(huì)終止。
二、對(duì)話機(jī)器人產(chǎn)品的發(fā)展源自搜索引擎
在我以前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗(yàn)》中,講述過(guò)一個(gè)概念,簡(jiǎn)單說(shuō):現(xiàn)在我明白一件事情,但是要完整清楚的講授給你,是很難的;因?yàn)槲覀兯鶕碛械闹R(shí)背景不同,我們對(duì)同一件事情的理解不同。這也就解釋了為什么很多老師在上課的時(shí)候索然無(wú)味,很多人做Presentation的時(shí)候顯得蒼白無(wú)力。
一個(gè)很大的問(wèn)題,就是每當(dāng)我們接觸到一個(gè)陌生事物時(shí),都會(huì)和自己的背景知識(shí)進(jìn)行類(lèi)比。譬如對(duì)于長(zhǎng)發(fā)飄飄的素顏美女,在我所知中,這類(lèi)美女一般都是家境不錯(cuò),待人溫柔,家教優(yōu)良。所以當(dāng)我再次見(jiàn)到一個(gè)類(lèi)似的美女時(shí),我會(huì)做相似的第一印象類(lèi)比。
不只是美女,我們幾乎所有的認(rèn)知都源自于過(guò)往的背景知識(shí)。
在人類(lèi)發(fā)展的歷史上,對(duì)于即時(shí)的問(wèn)答需求幾乎時(shí)時(shí)刻刻都存在。最早大家是詢問(wèn)部落中最年長(zhǎng)的智者,后來(lái)大家互相都有了知識(shí)儲(chǔ)備,就可以通過(guò)對(duì)話來(lái)進(jìn)行基本的問(wèn)答和辯論這一個(gè)過(guò)程持續(xù)了千萬(wàn)年。同一個(gè)問(wèn)題,最早時(shí)只能去問(wèn)一個(gè)人,得到一個(gè)答案;到后來(lái),可以去問(wèn)很多人,得到許多答案,然后擇其善者而從之。如果我能把所有人都問(wèn)一遍,可能會(huì)得到一個(gè)巨大的答案集合;我需要過(guò)濾、排序、取舍,工業(yè)機(jī)器人維修,你發(fā)現(xiàn),這個(gè)過(guò)程就是搜索引擎。我們使用搜索引擎時(shí),是通過(guò)一個(gè)輸入框輸入想問(wèn)的問(wèn)題或者關(guān)鍵詞,然后搜索引擎會(huì)丟給我一個(gè)經(jīng)過(guò)相關(guān)性排序和優(yōu)化的答案集合。
但我認(rèn)為兩個(gè)原因,會(huì)導(dǎo)致搜索引擎會(huì)逐漸向?qū)υ挋C(jī)器人演變。
2.1其一:精準(zhǔn)答案的需求愈發(fā)旺盛