[No.X029]
在剛剛過去的Smartbi V9新品發(fā)布會(huì)上,多位嘉賓為我們帶來的精彩演講在現(xiàn)場引起了熱烈反響,小麥從本周開始選取一些整理成文,與未能到場的麥粉們一起分享。現(xiàn)在分享的是Smartbi資深顧問杜健航所作《V9產(chǎn)品挖掘篇 -- 機(jī)器學(xué)習(xí),預(yù)測(cè)未來》的演講。
如剛才我們的CEO所說,目前智能BI的潮流是不可逆轉(zhuǎn)的,我們公司一直是站在潮頭。去年我在廣州塔那邊跟大家分享了智能助手小麥,那是代表了我們?cè)谥悄蹷I自然語言分析這一方向的努力和成果。今天,我想介紹的是我們的另外一個(gè)方向:數(shù)據(jù)挖掘。這個(gè)詞有點(diǎn)偏技術(shù),因此,我在開篇準(zhǔn)備了兩個(gè)故事,這也是我們最近做的兩個(gè)項(xiàng)目,將有助于大家對(duì)“數(shù)據(jù)挖掘”的了解。
【故事】
一、銀行客戶流失預(yù)警
銀行面臨同質(zhì)化競爭的市場環(huán)境,存款的利息都差不多,客戶忠誠度也不會(huì)很高,現(xiàn)在去拉一個(gè)新客戶的成本是遠(yuǎn)遠(yuǎn)高于維護(hù)老客戶的成本。因此,很多銀行都對(duì)防止客戶流失很重視。這家銀行當(dāng)時(shí)找到我們說,他們有一些歷史數(shù)據(jù),希望我們能從中預(yù)測(cè)出客戶流失的概率。這些歷史數(shù)據(jù)有客戶的固有屬性,如年齡、性別等,有行為屬性,如銀行卡收支情況、銀行APP使用情況,還有其它相關(guān)的屬性。接到這個(gè)需求以后,我們把工程師塞進(jìn)了甲方的小黑屋,一周后他們提交了一個(gè)分析模型,這個(gè)模型用甲方提供的1000份歷史數(shù)據(jù)測(cè)試,準(zhǔn)確率達(dá)到 86%。然后基于這個(gè)模型,為銀行的客戶建立了標(biāo)簽,分為:流失客戶、動(dòng)搖客戶、忠誠客戶3類。根據(jù)這3類標(biāo)簽,銀行可以采取不同的措施。最后銀行針對(duì)“動(dòng)搖客戶”進(jìn)行二次細(xì)分,然后進(jìn)行針對(duì)性關(guān)懷和獎(jiǎng)勵(lì),成功挽留了 50%以上的客戶,大大節(jié)省了投入成本。
二、違章建筑識(shí)別
第二個(gè)故事與城市管理有關(guān)。大家知道在城市管理中,有一個(gè)重要的工作內(nèi)容是違章建筑處理。違建處理首先要去調(diào)查與識(shí)別哪個(gè)是違建,這是一件工作量大,周期長,且有危險(xiǎn)性的工作。當(dāng)前違章的識(shí)別是被動(dòng)式的,靠舉報(bào)然后人工去查證,我們客戶想尋求用技術(shù)手段來提高效率。于是我們又把工程師塞進(jìn)了小黑屋,這次他們一個(gè)月后才走出來,因?yàn)檫@次的難度比上一個(gè)需求高了不少。這個(gè)模型對(duì)圖片的建筑識(shí)別率達(dá)到了 90%以上,同時(shí)該模型還能對(duì)建筑范圍進(jìn)行標(biāo)定。這里是一個(gè)中間結(jié)果圖片,那些被虛線框起來的就是模型所識(shí)別的一個(gè)個(gè)建筑物,深紅色部分就是一個(gè)可能違章的建筑,疑似違法擴(kuò)建?梢钥吹轿覀儗(shí)現(xiàn)了客戶的需求,客戶因此大大節(jié)省了人力,提升了處理速度。原來三四十人的巡查隊(duì),變?yōu)榱宋辶说臒o人機(jī)操作與數(shù)據(jù)處理人員。從這個(gè)故事可以表明我們具有應(yīng)用高級(jí)算法定制客戶專屬的圖像識(shí)別能力,也可以應(yīng)用到其它場景如公眾場所人流預(yù)警,商場貨架補(bǔ)貨提醒。
三、全新挖掘模塊
我剛才提到工程師為客戶需求建立的各種分析模型,就是基于我們的Smartbi V9全新的數(shù)據(jù)挖掘模塊Smartbi Mining。這也是今天我要介紹的主要內(nèi)容。在過去的十多年里,Smartbi的產(chǎn)品團(tuán)隊(duì)在傳統(tǒng)BI、自助BI領(lǐng)域,將強(qiáng)大功能與簡捷易用結(jié)合在一起帶給我們的客戶。今天,我們希望在智能BI、數(shù)據(jù)挖掘領(lǐng)域能給大家?guī)硗瑯拥母惺堋?/p>
四、Smartbi Mining的優(yōu)點(diǎn)
Smartbi Mining操作起來非常簡單,建模、訓(xùn)練、部署等都是在一個(gè)界面完成。業(yè)務(wù)人員可以參與,整個(gè)過程很直觀。里面有很多內(nèi)置的模型算法,模型參數(shù)也是默認(rèn)調(diào)整到最優(yōu)狀態(tài),大大降低了使用門檻。而且,系統(tǒng)隨時(shí)可以擴(kuò)展,處理海量數(shù)據(jù)也不會(huì)出現(xiàn)問題。
【功能簡介】
一、數(shù)據(jù)源與數(shù)據(jù)處理
Smartbi Mining可以輕松接入各種大數(shù)據(jù)場景下的數(shù)據(jù)源,如Hadoop、Spark,也包括阿里云、華為的數(shù)據(jù)源,傳統(tǒng)的Smartbi數(shù)據(jù)源也可以無縫集成。也就是說,無論是結(jié)構(gòu)化數(shù)據(jù),還是非結(jié)構(gòu)化數(shù)據(jù),我們都可以拿來進(jìn)行挖掘。在數(shù)據(jù)處理方面,無論是常規(guī)的要求,還是高級(jí)的要求,如One-Hot編碼、特征離散等都能滿足。
二、可視化挖掘
如果大家有一些挖掘項(xiàng)目經(jīng)驗(yàn)的話,就會(huì)知道經(jīng)歷是比較痛苦的;旧鲜羌兗夹g(shù)人員的工作,就是敲代碼,業(yè)務(wù)人員是很難參與的,只能最后拿一個(gè)結(jié)果。這種做法要么實(shí)施周期很長,要么就是得出來的結(jié)果難以理解,要么就是完全訂制調(diào)整不了,這些問題現(xiàn)在都能解決。Smartbi Mining是完全通過拖拉拽建模,整個(gè)過程、結(jié)果都可以看得到,業(yè)務(wù)人員是可以參與的。
三、內(nèi)置大量經(jīng)典算法
Smartbi Mining包含五大類算法,分別是分類算法、回歸算法、聚類算法、文本分析和深度學(xué)習(xí)。更重要的是,這些組件算法是可擴(kuò)充的,客戶可以根據(jù)應(yīng)用場景去訂制其它的算法。
四、算法與模型
市面上很多挖掘產(chǎn)品并不能支持企業(yè)級(jí)、大團(tuán)隊(duì)開發(fā),要支持企業(yè)級(jí)挖掘應(yīng)該有什么能力?我認(rèn)為需要具備3點(diǎn)。第一,我們能將模型進(jìn)行單獨(dú)的保存與使用,這樣就能使模型訓(xùn)練調(diào)優(yōu)與模型使用分離,便于大型項(xiàng)目開展;第二,在企業(yè)級(jí)開發(fā)會(huì)嘗試多種模型,甚至是聯(lián)合使用模型,能使多個(gè)模型一起工作;第三,你所做的所有工作都是能一鍵導(dǎo)入、導(dǎo)出,環(huán)境遷移十分簡便。Smartbi Mining具備這些特性,所以才能說是支持企業(yè)級(jí)挖掘。
五、服務(wù)發(fā)布
在挖掘項(xiàng)目中,將模型部署生產(chǎn)是最后一公里,這是一個(gè)繁瑣的過程,但在Smartbi Mining中已經(jīng)成為過去。用戶可以一鍵完成部署,將訓(xùn)練好的模型部署成為Web服務(wù),然后直接通過調(diào)用該API向其發(fā)送數(shù)據(jù),獲取預(yù)測(cè)結(jié)果。Smarbi Mining還能對(duì)所有部署的服務(wù)進(jìn)行統(tǒng)一管理,直接通過界面控制服務(wù)的啟停。也支持修改服務(wù)的配置信息,例如服務(wù)別名、服務(wù)描述,對(duì)于管理員十分的簡便。
六、小結(jié)
從我上面對(duì)挖掘功能的介紹中,大家了解到Smartbi這次發(fā)布的是一個(gè)一體化的數(shù)據(jù)挖掘模塊,提供從數(shù)據(jù)處理、建模到發(fā)布投產(chǎn)、運(yùn)維管理的全流程支持,一個(gè)界面完成。同時(shí)它是一個(gè)全能型模塊,能滿足各方面人群的使用需求,無論你是數(shù)據(jù)挖掘?qū)<遥是有一定經(jīng)驗(yàn)的技術(shù)人員,或者是沒有任何經(jīng)驗(yàn)的業(yè)務(wù)用戶,相信都可以輕松使用,并從中受益。
【挖掘?qū)嵺`】
產(chǎn)品這么強(qiáng)大又易用,我估計(jì)臺(tái)下已經(jīng)有客戶在考慮實(shí)踐挖掘的項(xiàng)目了,下面我簡單介紹一下一個(gè)挖掘項(xiàng)目是如何落地的。
一、挖掘?qū)嵤┝鞒?/strong>
通常來說是挖掘項(xiàng)目都能劃分為 4個(gè)步驟。首先是確定商業(yè)目標(biāo),這個(gè)目標(biāo)同時(shí)要具備業(yè)務(wù)定義與技術(shù)定義,例如我們前面提到的預(yù)測(cè)客戶的流失概率,就是一個(gè)明確的目標(biāo)。第二步是進(jìn)行數(shù)據(jù)的準(zhǔn)備與模型建立。這兩者其實(shí)是統(tǒng)一的,使用什么算法建立模型其實(shí)與具備什么數(shù)據(jù)密切相關(guān)。這里面會(huì)進(jìn)行不斷的實(shí)驗(yàn)與調(diào)整。接下來,模型相對(duì)穩(wěn)定后,就需要用不同的評(píng)估方法進(jìn)行模型的評(píng)估與參數(shù)調(diào)優(yōu)。在達(dá)到一定的準(zhǔn)確率后,模型就能進(jìn)行部署,如前面所述這個(gè)在我們產(chǎn)品里面就很簡便了。而部署并不是終結(jié),挖掘項(xiàng)目通常都需要迭代。如調(diào)整目標(biāo)、補(bǔ)充數(shù)據(jù)、優(yōu)化模型性能等,這也是我們很多項(xiàng)目都是多期的。
二、挖掘應(yīng)用領(lǐng)域
通過前面內(nèi)容,大家應(yīng)該對(duì)我們挖掘功能及其具體應(yīng)用有一定的了解。除了前面提到的流失預(yù)警、圖像識(shí)別外,Smartbi Mining還能應(yīng)用到價(jià)格預(yù)測(cè)、異常行為偵測(cè)、網(wǎng)絡(luò)輿情分析等等諸多方面,應(yīng)用范圍是十分廣泛的。
【我們的優(yōu)勢(shì)】
一、挖掘與BI緊密相連
對(duì)比其它友商,Smartbi Mining與BI是緊密相連的。使用BI的數(shù)據(jù)源、數(shù)據(jù)集,已有項(xiàng)目資源能充分利用。結(jié)果利用BI 的成熟展現(xiàn)技術(shù),在數(shù)據(jù)觀察、結(jié)果輸出時(shí),展現(xiàn)的效果更加多樣。反過來,BI的功能也被增強(qiáng)了,挖掘的高級(jí)數(shù)據(jù)處理功能可以被BI 使用。原來BI都是處理結(jié)構(gòu)化的數(shù)據(jù),現(xiàn)在文本、圖片、后續(xù)的音視頻非結(jié)構(gòu)化數(shù)據(jù)都能處理,極大增強(qiáng)BI的應(yīng)用范圍。并且在BI的數(shù)據(jù)分析界面直接提供預(yù)測(cè)入口,大大降低了挖掘的使用門檻。
二、團(tuán)隊(duì)實(shí)力
要保證挖掘項(xiàng)目成功,除了有成熟、易用的產(chǎn)品,更重要是要有專業(yè)的咨詢與實(shí)踐團(tuán)隊(duì),Smartbi就有這樣的團(tuán)隊(duì)。我們最近參加了兩個(gè)比賽,一個(gè)是全球數(shù)據(jù)資源開發(fā)者大賽,這是一個(gè)中國互聯(lián)網(wǎng)協(xié)會(huì)舉辦的比賽,我們參與了中國移動(dòng)專題,取得了第2名的好成績。另一個(gè)是中國載人航天工程辦公室主辦的天宮數(shù)據(jù)利用青年創(chuàng)新大賽,這個(gè)比賽就更為激烈了,全國的大型公司,各個(gè)高校都有參與,我們也闖進(jìn)前10,最終排名第6。
三、應(yīng)用成熟
Smartbi Mining雖然今天才發(fā)布,但其實(shí)已經(jīng)開發(fā)與應(yīng)用有一段時(shí)間了。我們不少的客戶已經(jīng)成功實(shí)踐,為他們帶來實(shí)實(shí)在在的價(jià)值。其中就有稍后會(huì)分享的招商信諾,他們已經(jīng)使用了一段時(shí)間了,據(jù)反饋效果還不錯(cuò),我覺得大家可以放心使用。
在這個(gè)大數(shù)據(jù)的時(shí)代,每個(gè)企業(yè)都希望從數(shù)據(jù)里面獲得價(jià)值,我們推出Smartbi Mining就是希望幫助大家更好、更快地做這個(gè)事情。如果說從BI 里面我們獲得的是金沙,那么從Mining里面,我們獲得的將是金塊。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...