第一階段
菜地里的毛菜(原始系統(tǒng)的數(shù)據(jù),有錯誤,,不精準(zhǔn),,毛菜有泥巴,有黃葉子),,相當(dāng)于ERP,PDM系統(tǒng)里面的原始數(shù)據(jù),。
第二階段
從菜地里采集到家,分門別類的堆在一起(初步去掉泥巴,,黃葉子,分類堆放),,相當(dāng)于從原系統(tǒng)到ODS,ODS的意思是操作數(shù)據(jù),即原始系統(tǒng)中的操作數(shù)據(jù)的一個副本,,與原始數(shù)據(jù)是一模一樣的,叫貼源,,這個過程就叫數(shù)據(jù)采集,、清洗,、轉(zhuǎn)換,即ETL干的事情,,這個階段叫初加工。
第三階段
把拿回家的各種菜洗凈,去皮,,按大小分類,去掉小的,、爛的蔬菜,,可以賣給超市了,,對BI項目來說,就是從ODS到數(shù)據(jù)倉庫的過程,,數(shù)據(jù)的精加工過程,,去偽存真,,也要用到ETL來清洗轉(zhuǎn)換,,對缺項的數(shù)據(jù)補充完整,,比如合并數(shù)據(jù),,合并字段,增加主數(shù)據(jù)描述字段,,補充分類等,。
第四階段
從菜農(nóng)賣到超市,,超市還要經(jīng)過一次加工,,比如包裝成一小包一小包的,把蔬菜放在一起,水果放在一起,,便于顧客直接購買,這一步就是從數(shù)據(jù)倉庫到數(shù)集市的過程,,數(shù)據(jù)集市就是包好、稱好的凈菜,,價簽已經(jīng)打好的了,,顧客直接付款可以拿走了,從數(shù)據(jù)倉庫到數(shù)據(jù)集市就是形成一個一個的數(shù)據(jù)立方體,,這個立方體的數(shù)據(jù)是加工好的,,可以單獨發(fā)布出去,離線使用,,相當(dāng)于一個execl數(shù)據(jù)文件,你可以用EXECL工具打開,,也可以用WPS打開,打開以后,,可以用表格表示,,也可以用圖表表示。
第五階段
媽媽配菜,,媽媽根據(jù)家人一天要吃的菜肴規(guī)劃,,挑選各種各樣的菜、肉組合在一起,,有的直接可以食用,,有的需要再加工,,即烹調(diào),然后端出來擺到餐桌上,,家人只需要帶一張嘴即可享用,對BI項目來說,,就是報表的制作過程,,業(yè)務(wù)分析人員,,根據(jù)領(lǐng)導(dǎo)的要求,,按照各個主題需求,,從各個數(shù)據(jù)立方體中、或者一部分從數(shù)據(jù)倉庫中取一些數(shù)據(jù)組合起來,,并且定義展現(xiàn)方式,,即把報表做好,,發(fā)布出來,,放到門戶上,,給與權(quán)限控制,哪些人可以享用這桌美味,,這就是報表制作這個階段干的事情,所以說,,業(yè)務(wù)人員是否可以拖拽制作報表,關(guān)鍵看前面的數(shù)據(jù)立方體準(zhǔn)備好沒有,,相當(dāng)于是這樣的,不是人人都是烹調(diào)高手,,但是超市里面有很多配好的菜(蔥姜蒜都有了),你只要拿回去放放鍋里炒5分鐘或者蒸煮10分鐘,,端出來即可,不難吧,。至于加工的工具是微軟家的鍋還是IBM家的灶,或者oracle家的飄,,有什么關(guān)系呢,,這些都是報表制作工具(烹調(diào)工具而已),。
第六階段
享受美味佳肴,把做好的一桌筵席,,放到門戶上,,當(dāng)然是給有權(quán)限的人享受,,這就是管理駕駛艙!
通過上面的分析,,懂的為什么會做飯的人就會做大數(shù)據(jù)分析了,簡單吧,,所以過年回家和媽媽學(xué)做飯,,學(xué)會了就懂得高大上的大數(shù)據(jù)分析。
附:美食制作過程和數(shù)據(jù)分析過程對比圖