泛談大數(shù)據(jù)+AI在征信行業(yè)的應(yīng)用
一、大數(shù)據(jù)+AI的優(yōu)勢(shì)
1、更準(zhǔn)確的評(píng)估用戶信用
解釋:能夠考慮過(guò)去可能沒(méi)有得到信用評(píng)分的人,或者可能被傳統(tǒng)的基于邏輯回歸的評(píng)分太匆忙地拒絕了。換句話說(shuō),AI可以查看消費(fèi)者信用記錄中的某些數(shù)據(jù)點(diǎn),計(jì)算他們即將償還的概率;或者考慮那些過(guò)去12個(gè)月都沒(méi)有還款(基于某些原因),但是在某一個(gè)數(shù)據(jù)點(diǎn),他們償還了所有的款項(xiàng)的人群。
2、AI對(duì)風(fēng)控的控制更加精確
解釋:人為的去做風(fēng)控,每一個(gè)人都會(huì)有自己的主觀看法和偏差,但是用AI+模型+大數(shù)據(jù)去判斷風(fēng)險(xiǎn),去控制風(fēng)險(xiǎn),可以令風(fēng)險(xiǎn)的控制和判斷更加精準(zhǔn)。
3、極大提升傳統(tǒng)征信行業(yè)的決策效率
解釋:AI對(duì)大數(shù)據(jù)量的加工處理更高效,決策效率也很高,替代了大部分的人工操作和決策過(guò)程。
二、AI(以DL為例)和ML(以LR為例)在征信大數(shù)據(jù)上的區(qū)別與聯(lián)系
區(qū)別:
1、DL對(duì)數(shù)據(jù)的學(xué)習(xí)更加全面深刻,www.whsntf.cn,而LR過(guò)于教條;
解釋:DL可以通過(guò)復(fù)雜的推理,在大數(shù)據(jù)中找到不明顯的東西(優(yōu)勢(shì)中的第一點(diǎn)),而往往這些特殊的、或者個(gè)別的才最重要;LR則要求我們對(duì)數(shù)據(jù)強(qiáng)行結(jié)構(gòu)化,這種做法容易消磨原始數(shù)據(jù)的真實(shí)性。
2、DL在訓(xùn)練時(shí)能夠兼顧多個(gè)變量之間的交互情況,而LR更多的是考慮單個(gè)變量;
3、LR對(duì)借款人的可解釋性更強(qiáng),DL目前難以提供專業(yè)的原因代碼(據(jù)說(shuō)Equifax公司已經(jīng)有了一套生成原因代碼的算法)。
聯(lián)系:
1、ML:任何通過(guò)數(shù)據(jù)訓(xùn)練的學(xué)習(xí)算法的相關(guān)研究;
2、DL:深度學(xué)習(xí)不僅僅是具備多層架構(gòu)的感知器,而是一系列能夠用來(lái)構(gòu)建可組合可微分的體系結(jié)構(gòu)的技術(shù)和方法;
3、AI是一個(gè)很大的概念,而ML則是AI的一個(gè)分支》ML是AI的子集;
4、機(jī)器學(xué)習(xí)包括了ANN(人工神經(jīng)網(wǎng)絡(luò)),而ANN是深度學(xué)習(xí)的起源》DL是ML的子集;
5、AI==ML+NLP、圖像處理、人臉識(shí)別、語(yǔ)音識(shí)別、知識(shí)圖譜等
ML==DL+LR、貝葉斯、SVM等
圖1AI、ML、DL的聯(lián)系
三、大數(shù)據(jù)+AI技術(shù)如何應(yīng)用到征信行業(yè)
大數(shù)據(jù)+ML:利用大量用戶金融交易行為記錄類數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)方法,建立模型,預(yù)測(cè)用戶信用情況,給出不同形式的反饋結(jié)果;
大數(shù)據(jù)+AI:人工智能補(bǔ)充ML的不足,驅(qū)動(dòng)征信業(yè)的發(fā)展;
AI可以通過(guò)那些手段、方法,補(bǔ)充ML的不足呢?
DNN:深度訓(xùn)練、分析用戶信貸類數(shù)據(jù),工業(yè)機(jī)器人維修,分析多個(gè)變量之間的交互;
NLP:智能問(wèn)答系統(tǒng)、智能機(jī)器人解決信貸者的疑問(wèn);
圖象處理:掃描信貸者的證件;
人臉識(shí)別:人臉識(shí)別活體,和身份證做對(duì)比;
知識(shí)圖譜:解決反詐問(wèn)題、不一致性驗(yàn)證等;
知識(shí)圖譜應(yīng)用舉例如下:
1)不一致性驗(yàn)證
解釋:張三、李四不同公司,但是同一個(gè)電話,這就是風(fēng)險(xiǎn)點(diǎn),但是我們的實(shí)名認(rèn)證沒(méi)有包括這個(gè)信息;
解釋:張三和李四是朋友關(guān)系,而且張三和借款人也是朋友關(guān)系,那我們可以推理出借款人和李四也是朋友關(guān)系,而不是父子關(guān)系(紅包關(guān)系鏈的問(wèn)題);
2)組團(tuán)欺騙
解釋:張三、李四和王五之間沒(méi)有直接關(guān)系,但通三者之間都共享著某一部分信息,組團(tuán)的可能性較高。雖然組團(tuán)欺騙的形式眾多,但有一點(diǎn)值得肯定的是知識(shí)圖譜一定會(huì)比其他任何的工具提供更佳便捷的分析手段。
四、監(jiān)管(萬(wàn)存知局長(zhǎng))和業(yè)界對(duì)征信業(yè)的看法
1、信用評(píng)分信用模型所用信息不能包括非信貸類(比如某寶所用的特征維度有:學(xué)習(xí)及職業(yè)經(jīng)歷、人脈關(guān)系(已經(jīng)涉及隱私)等,是不可以的。┬畔;
2、應(yīng)用場(chǎng)景主要在金融領(lǐng)域,特定的用途需要特定的授權(quán);
3、個(gè)人征信三個(gè)原則:第三方征信的獨(dú)立性;征信活動(dòng)中的公正性;個(gè)人信息隱私權(quán)益保護(hù);
4、個(gè)人征信≠社會(huì)信用體系(個(gè)人理解:主要是指應(yīng)用場(chǎng)景的范圍吧,像機(jī)場(chǎng)快速通道、談戀愛(ài)等,有點(diǎn)夸張了,也是某寶的主意)。
后記展望
人工智能聽(tīng)起來(lái)確實(shí)很強(qiáng)大,但是就目前的成果而言,只是提高了人類的工作效率,落實(shí)到具體的應(yīng)用場(chǎng)景,庫(kù)卡機(jī)器人何服電機(jī)維修,我們還需要更加努力的探索和思考。特別是在金融領(lǐng)域和征信行業(yè),我們更需要投入大量精力,不斷嘗試,不斷創(chuàng)新,積極利用人工智能新技術(shù),新方法,提高工作效率,提升模型精度,提升用戶體驗(yàn)。