在辦公筆記本玩轉(zhuǎn)基于星型模型的自助探索分析

2017/12/13 10:21 IT產(chǎn)業(yè)網(wǎng)

　　概要：

　　在DELL燃7000筆記本電腦上(i5-7200u)，對億級事實表&維度表的探索式分析，平均響應(yīng)性能從11.9秒優(yōu)化到8.9秒，提升程度約25%，這一切歸功于Smartbi+Vertica的高性能自助分析解決方案!

　　難點：

　　星型模型又稱Star-schema，是一種數(shù)據(jù)庫的建模(組織數(shù)據(jù))的方式，它與三范模型3-NF的知名度等高。由于這類模型都是以“事實表”為核心，圍繞幾個維度表，所以非常形象的被稱為“星型”。

　　在沒有犧牲空間換時間(OLAP)的數(shù)據(jù)分析場景下，這樣的建模方式非常有利于數(shù)據(jù)更新，因為維護事實表的增量以及事實表和維度表的數(shù)據(jù)一致性比較快速，或者說ETL的時間窗口比較小。但其對于查詢類型的分析應(yīng)用，卻需要消耗大量的“關(guān)聯(lián)”運算，對CPU來說是比較操作，因此在很多大數(shù)據(jù)量的數(shù)據(jù)倉庫系統(tǒng)中，往往其查詢性能并不好。

　　更具挑戰(zhàn)的是，在需要提供自助探索的分析平臺上(比如Smartbi的透視分析以及Tableau等)，業(yè)務(wù)人員無法預(yù)料的會動態(tài)生成各種查詢請求，從技術(shù)的角度說就是SQL沒有規(guī)律，任何字段都可能是where條件、group分組以及計算字段，這就導(dǎo)致索引等傳統(tǒng)DBA的手段毫無用武之地。

　　干貨

　　關(guān)注過Smartbi公眾號的同學(xué)可能知道，Smartbi在7月份與Vertica進行了戰(zhàn)略合作，基于這個新一代列式MPP數(shù)據(jù)庫發(fā)布了“高性能自助分析解決方案“，在隨后9月的workshop中提供了1個億級的星型數(shù)據(jù)模型和22個性能測試案例。

　　我在本人筆記本電腦對V201709版星型模型做了性能測試，平均響應(yīng)時間為11.9秒，個人感受只能是差強人意。22個測試案例的結(jié)果如下，單位為秒：

　　筆記本電腦型號燃7000，配置如下，只不過操作系統(tǒng)為了安裝Vertica改成了linux：

　　這個配置和價位是非常親民的吧，尤其這顆CPU在牙膏廠(Intel)的產(chǎn)品里根本排不上號。

　　言歸正傳，最近本人研究了一下Smartbi的這個星型數(shù)據(jù)模型，對其做了2項調(diào)整工作，第一是將3個維度表的關(guān)聯(lián)字段改成了整型(當(dāng)然首先是在維度表增加了車型、姓名、城市的整數(shù)編號，其次是在事實表增加這3個字段)，第二是對事實表按年份進行了分區(qū)。

　　同樣按照22個案例進行了測試，就得到了25%的性能提升，達到8.9秒，結(jié)果棒棒的!

　　具體來說，前3個測試案例是對事實表3個字段的分組求和，不涉及任何優(yōu)化的內(nèi)容，所以沒有什么改變，甚至由于隨機性的誤差還有一些下降。從第四個開始，2個優(yōu)化手段開始發(fā)揮作用，平均提升更大(30%)。

　　既然此次優(yōu)化用了2個手段，那么它們各自有多大貢獻呢?(原諒本人懶得重新測)

　　將測試案例的三類對比來看，因為”同比計算“和”條件匯總“都用到年份作為條件，我們暫且可以認(rèn)為它們更能體現(xiàn)按年做分區(qū)的優(yōu)化作用，這里它們分別提升了27%和32%，比普通的全表匯總提升的21%更有效果，就認(rèn)為有5%-10%的提升吧。

　　另外從這個圖可以看到，以前同比計算的平均性能比全表匯總明顯要慢，但優(yōu)化后基本差不多了，都在11秒左右。而按年條件匯總的平均性能從6秒提升到4秒，真的是非常優(yōu)秀了!

　　總結(jié)

　　只有用列式數(shù)據(jù)庫，才可能降低大數(shù)據(jù)量分析對IO的硬性要求，使得采用筆記本做數(shù)據(jù)分析成為可能。但能把1億數(shù)據(jù)量的星型模型玩轉(zhuǎn)自助分析的，目前也就是Smartbi+Vertica，最后給Smartbi透視分析的同環(huán)比計算、分組字段和自由鉆取點個贊，以后有空再繼續(xù)挑戰(zhàn)這個任務(wù)!

　　寫在最后：該優(yōu)化的模型已經(jīng)被Smartbi采納，用于后續(xù)的workshop活動!

　　榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

在辦公筆記本玩轉(zhuǎn)基于星型模型的自助探索分析

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題

最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

在辦公筆記本玩轉(zhuǎn)基于星型模型的自助探索分析

相關(guān)閱讀

最新新聞

熱門新聞

新動態(tài)

關(guān)注度

最話題