國外的企業一般不會使用 Data Standards 這個詞,它會具體映射到左邊的,比如 Glossary,就是業務術語,或者說 Data Dictionary、數據字典,還有 Data Elements 就是數據元或數據項。在他們的語境當中業務術語是面向公司所有受眾的,需要確保在一個組織中大家都使用正確的術語。數據字典更多的是給技術員工在管理數據的時候用的,它定義描述數據集,還有數據字段相關的屬性。
數據質量指的是在特定的業務環境下,數據滿足業務運行、管理與決策的程度,是保障數據應用效果的一個基礎。數據質量管理指的是運用相關的技術來衡量、提高和確保數據質量的規劃、實施與控制的一系列活動。所以從這里面可以看出數據質量也是一個非常龐大的系統工程。數據質量真正要去落地的時候,有以下幾點需要注意:(1)真正去落地是需要和具體的企業當中的經營管理痛點相結合,需要企業內部的 IT 數據團隊和業務團隊一起解決問題。(2)PDCA 的循環要做起來,走通一個閉環之后,后面要持續去迭代。(3)不能夠期望僅僅依靠一個工具或者多個工具就能夠解決數據質量的問題,它只能夠解決一部分的通用問題。
這個是對于集中式管理的組織保障的拆解,首先應該有個決策組織,這決策組織可以是數據治理的委員會,然后在下面去做管理的應該有一個數據治理的辦公室。對于每一個職能域都有對應的負責人,在每個業務單元有對應的數據的責任人,在 IT 層面也有對應的比較明細的分工,去解決我們梳理當中出現的問題。02工具和技術接下來分享第二部分是數據標準和數據質量相關的工具。