?

供水企業數據字典建立方法的探討

2020-08-25 13:41魏曉婷張雅琪
天津科技 2020年8期
關鍵詞:數據項字典供水

崔 鳴,魏曉婷, ,張雅琪

(1. 天津泰達水業有限公司 天津300457;2. 天津泰達津聯自來水有限公司 天津300457)

0 引 言

在工業4.0時代,智慧水務建設是傳統供水企業升級為一體化管理水務企業的重要工具和手段,是在數字經濟環境下轉變傳統供水企業發展方式、實現科學發展的重要途徑。智慧水務的支撐技術包括物聯網、云計算、人工智能、大數據分析和應用。其中大數據分析和應用是通過對海量的生產經營數據進行分析挖掘,找到客觀規律并建立數學模型,通過預測未來趨勢及行為,做出準確應對和科學決策的一種技術。

要做好大數據分析應用工作,就一定要關注最基礎和最核心的因素,就是數據。在多數供水企業中,“數據即資產”已經被廣泛認知。很多供水企業開始重視數據資產管理,將挖掘和釋放數據價值、擴展數據應用和服務作為創新發展的驅動力。但是并非所有數據都能成為資產,如若沒有合適的數據資產管理體系和架構作為保障,再多的數據對于供水企業來說也只是垃圾和負擔,無法提供有效的決策和數據服務。目前,很多供水企業下大力量關注智慧水務項目建設,但是在數據管理方面缺乏重視,存在著數據架構失控、元數據管理混亂、數據標準缺失、數據質量參差不齊、數據增長無序、數據安全等問題,而供水企業數據字典的建立,可以稱作是數據管理中基礎的基礎。如果說語言是人類世界溝通的方法,數據字典則是數據世界溝通的語言,任何數據都需要通過看得懂的方式表達出來,只有看懂數據表達什么意思,才有基于數據分析和創造的可能,才能實現數據知識的傳承。在目前多數供水企業中很少見到建立數據字典并開展研究和建立的報道。天津泰達水業有限公司2019年開始立項組織公司數據字典的建立和研究工作,本文從供水企業數據的特點和分類、供水企業數據字典建立的方法路徑等方面進行探討研究。

1 供水企業基礎數據的特點和分類

對于常規的制造類企業而言,生產的核心是產品,經營的核心是用戶,因此制造類企業數據字典的編制是圍繞著產品和經營的。就產品而言,將產品全生命周期有關的描述用來定義產品的各個特性,按照一定的邏輯關系進行分層式的樹狀結構分類,并按照標準規定的格式進行描述,形成產品及相關零件的數據字典。也就是說,制造類企業產品的數據字典是由產品族分類樹、產品族描述、產品族特性描述 3部分組成[1]。

依此類推,經營類數據字典則是按照經營渠道支撐、業務運營支撐(BOSS)、客戶關系系統支撐(CRM)以及公共資源支撐4方面展開和描述。

對于供水企業,生產的核心產品是水,非常單一;經營銷售受到地域許可的限制,更側重于提供服務而不是營銷。這 2個特點使得供水企業的數據字典與制造類、經營類企業差別很大,很難套用某種通用化的模式來對供水企業數據進行描述。

供水企業是以提供優質、穩定、高效、安全供水保障為目標的企業,核心業務是制水生產、水質安全、管網輸配、客戶服務 4大體系。對應的數據信息體系為生產工藝數據體系、水質監測數據體系、調度與管網運行數據體系、客戶服務數據體系。供水企業數據字典也是圍繞上述4個數據體系而編制。

2019年 12月 1日正式執行的 CJ/T 541—2019《城鎮供水管理信息系統 基礎信息分類與編碼規則》把城鎮供水基礎信息分為基礎信息、供水單位、供水水廠、供水建設等 8個大類,每個大類之下展開多個中類,如在城鎮供水單位基礎信息分類中劃分了28個中類項,在供水水廠基礎信息分類中劃分了11個中類項[2],等等。

對于一個供水企業而言,數據字典是為企業本身大數據應用服務的,不需要分類太多,前述的供水水廠、水質監測、管網調度運行、客戶服務 4個大類基本可以涵蓋。在《城鎮供水管理信息系統基礎信息分類與編碼規則》中提供的均屬于基礎數據信息,而在供水企業的實際運行中還存在大量的管理流程和管理信息,例如水廠和管網的巡檢流程、維修工單流程等,客戶服務的報修服務流程、水表校驗流程等。不同的供水企業都有各具特色的管理,因此針對管理信息的數據字典編制和分類并沒有統一的模式。

2 供水企業數據字典建立的方法

天津泰達水業有限公司數據字典編制工作小組根據自身企業的特點,經過反復論證,決定采用自頂向下設計、逐層展開細化的方法,以 4大類別基礎信息作為塊結構、以業務流程作為線結構鋪開數據項,再分專業、分組進行特性描述和引用導引描述。具體采取以下幾個步驟。

2.1 步驟一

依照公司的管理體系制度、管理程序,全面梳理業務流程和數據報表。經過梳理,公司共有 26類、108項管理流程,如表1所示。

表1 天津泰達水業有限公司業務流程和數據報表Tab.1 Business process and data report of Tianjin TEDA Water Industry Co. , Ltd.

在公司現行 97項管理制度和管理程序中,共提取和梳理出 295個數據表格,其中包括流轉工單類157個、數據表格類38個、標準與臺賬類36個、制式報文類 59個、其他 5個。在上述 295個表格中可提取的數據項約2700多個。

2.2 步驟二

工作組成員分工到水廠、管網、水質、客服等部門進行各個分塊基礎數據的采集。

以水質基礎數據采集為例。首先依據CJ/T 4741—2015《城鎮供水管理信息系統 供水水質指標分類與編碼》的規定,從 6大項、20個分項、595個水質指標中,選取公司三級檢測體系中具備檢測能力和國標要求的指標。例如在放射性指標大類中有9項指標[3],我公司在日常檢測中需要用到其中總α 放射性(Gross alpha particle activity)和總β 放射性(Gross beta particle activity)2項指標,就把這2項列入到數據字典中。

其次是根據目前三級檢測體系中所執行的原水檢測、出廠水檢測、管網水檢測、二供水檢測等所檢測的項目、方法,以及關聯的試劑、儀器、?;返?,分門別類列入數據字典條目。

通過以上2個步驟,已經搭建好天津泰達水業有限公司的數據字典基本架構,完成了從上到下設計、細化和展開的任務。

2.3 步驟三

唯一性校核?;A數據項的編制是需要具備唯一性、合理性、可擴展性、簡明性等若干原則的,而唯一性是最基本的原則。例如在管網上安裝的閥門就有多種稱呼,有稱作腰閘的,也有稱作閘閥的;一個居民小區往往也會有不同的俗稱,比如某小區正式的名字叫某某家園,可是很多小區業主和物業公司均稱呼為某某二期。這類對同一個事物進行不同的稱謂是數據字典編制中最應該避免出現的,因此一定要進行唯一性校核。

2.4 步驟四

特性描述。特性描述相當于編篡字典的詞條說明,其工作量最大、專業性最強。

2.5 步驟五

引用導引描述。這也是專業性和難度非常大的工作。例如對于一項水質指標的檢測可以有幾種不同的方法,這就需要對這個數據項的引用部分進行導引描述,或通過鏈接的方式便于使用者迅速查詢到相關的條目。引用導引描述按照數據的不同類型,可分為流程導引描述、方法導引描述、屬性導引描述等。通過上述步驟形成的數據項表格基本如表2所示。

表2 數據字典數據項表格Tab.2 Data item table of data dictionary

3 體會和結論

通過天津泰達水業有限公司數據字典的編制方法設計和實施體驗,有3點體會和結論:

① 供水企業如果步入智慧化發展的道路,大數據采集、大數據分析和數學模型建立是必經之路,而數據字典的建立是繞不過去的門檻。

② 智慧水務建設不是單靠投資就可以建成的,供水企業必須擁有一支與智慧化運行管理要求相適應的綜合技術管理團隊。而供水企業自主編制數據字典,是培養技術人員熟悉基礎管理的重要手段。

③ 數據字典的編制是需要投入一定的人力和精力的基礎性工作,不像工程建設那樣容易得到明顯的效果,更加需要供水企業領導層的關注和引領。

猜你喜歡
數據項字典供水
美國供水與清潔基礎設施不足造成每年85.8億美元經濟損失
各地完成農村供水工程建設投資466億元 農村水利建設再提速
國六柴油車遠程排放監測數據項間相關性特征研究*
基于相似度的蟻群聚類算法?
四會地豆鎮加快推進農村集中供水全覆蓋
毗河供水一期工程
非完整數據庫Skyline-join查詢*
基于Python的Asterix Cat 021數據格式解析分析與實現
字典的由來
大頭熊的字典
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合