第一階段
菜地里的毛菜(原始系統(tǒng)的數(shù)據(jù),,有錯誤,,不精準(zhǔn),,毛菜有泥巴,,有黃葉子),相當(dāng)于ERP,,PDM系統(tǒng)里面的原始數(shù)據(jù),。
第二階段
從菜地里采集到家,分門別類的堆在一起(初步去掉泥巴,,黃葉子,,分類堆放),相當(dāng)于從原系統(tǒng)到ODS,ODS的意思是操作數(shù)據(jù),,即原始系統(tǒng)中的操作數(shù)據(jù)的一個副本,,與原始數(shù)據(jù)是一模一樣的,叫貼源,,這個過程就叫數(shù)據(jù)采集,、清洗、轉(zhuǎn)換,,即ETL干的事情,,這個階段叫初加工。
第三階段
把拿回家的各種菜洗凈,,去皮,,按大小分類,去掉小的,、爛的蔬菜,,可以賣給超市了,對BI項目來說,,就是從ODS到數(shù)據(jù)倉庫的過程,,數(shù)據(jù)的精加工過程,去偽存真,,也要用到ETL來清洗轉(zhuǎn)換,,對缺項的數(shù)據(jù)補充完整,比如合并數(shù)據(jù),,合并字段,,增加主數(shù)據(jù)描述字段,補充分類等,。
第四階段
從菜農(nóng)賣到超市,,超市還要經(jīng)過一次加工,比如包裝成一小包一小包的,,把蔬菜放在一起,,水果放在一起,便于顧客直接購買,,這一步就是從數(shù)據(jù)倉庫到數(shù)集市的過程,,數(shù)據(jù)集市就是包好、稱好的凈菜,,價簽已經(jīng)打好的了,,顧客直接付款可以拿走了,從數(shù)據(jù)倉庫到數(shù)據(jù)集市就是形成一個一個的數(shù)據(jù)立方體,,這個立方體的數(shù)據(jù)是加工好的,,可以單獨發(fā)布出去,,離線使用,相當(dāng)于一個execl數(shù)據(jù)文件,,你可以用EXECL工具打開,,也可以用WPS打開,打開以后,,可以用表格表示,,也可以用圖表表示。
第五階段
媽媽配菜,,媽媽根據(jù)家人一天要吃的菜肴規(guī)劃,,挑選各種各樣的菜、肉組合在一起,,有的直接可以食用,,有的需要再加工,即烹調(diào),,然后端出來擺到餐桌上,,家人只需要帶一張嘴即可享用,對BI項目來說,,就是報表的制作過程,,業(yè)務(wù)分析人員,根據(jù)領(lǐng)導(dǎo)的要求,,按照各個主題需求,,從各個數(shù)據(jù)立方體中、或者一部分從數(shù)據(jù)倉庫中取一些數(shù)據(jù)組合起來,,并且定義展現(xiàn)方式,,即把報表做好,發(fā)布出來,,放到門戶上,,給與權(quán)限控制,哪些人可以享用這桌美味,,這就是報表制作這個階段干的事情,,所以說,業(yè)務(wù)人員是否可以拖拽制作報表,,關(guān)鍵看前面的數(shù)據(jù)立方體準(zhǔn)備好沒有,,相當(dāng)于是這樣的,不是人人都是烹調(diào)高手,,但是超市里面有很多配好的菜(蔥姜蒜都有了),,你只要拿回去放放鍋里炒5分鐘或者蒸煮10分鐘,端出來即可,不難吧,。至于加工的工具是微軟家的鍋還是IBM家的灶,,或者oracle家的飄,有什么關(guān)系呢,,這些都是報表制作工具(烹調(diào)工具而已),。
第六階段
享受美味佳肴,把做好的一桌筵席,,放到門戶上,當(dāng)然是給有權(quán)限的人享受,,這就是管理駕駛艙!
通過上面的分析,,懂的為什么會做飯的人就會做大數(shù)據(jù)分析了,簡單吧,,所以過年回家和媽媽學(xué)做飯,,學(xué)會了就懂得高大上的大數(shù)據(jù)分析。
附:美食制作過程和數(shù)據(jù)分析過程對比圖