?

校園數據服務實踐的困境與對策研究

2019-09-10 07:22薛鵬劉丹陽田海杰
北京聯合大學學報 2019年2期
關鍵詞:數據服務

薛鵬 劉丹陽 田海杰

[摘要]校園數據服務是一種以數據為驅動的智能化管理服務生態,這也是高校智慧校園的本質。當前高校數據服務的典型困境包括由初期分散的系統建設帶來的數據孤島問題、系統內部的數據質量問題、對待數據資產及數據服務的私有觀念問題等。若突破以上困境,需要從數據資產清理、數據質量提升、數據交換平臺及主數據庫建設等角度出發,在現有數據資產的基礎上充分梳理其內容和生命周期,厘清數據質量保障的關鍵環節,建立數據互通交換的基本模式與平臺,科學規劃校園數據服務框架。

[關鍵詞]數據服務;共享開放;服務框架

[中圖分類號]TP 393.18[文獻標志碼]A[文章編號]1005-0310(2019)02-0032-05

Abstract: Data service on campuses is a kind of intelligent management environment with a remarkable data-driven feature, which is the nature of intelligent campuses in colleges or universities. At present, the typical difficulties in carrying out data service contain “isolated data island” brought by decentralized construction of information systems earlier, data qualities, the concept of data exclusivity and so forth. A series of procedures might be the effective directions to deal with this situation. They include the data asset cleanup aiming at sorting out the existing data asset, combing the crucial part of data quality assurance and building up data exchange platform as well as its modes, scientifically planning data service framework on campus.

Keywords: Data service; Open sharing; Service framework

0引言

校園數據服務是一種以數據為驅動的智能化管理服務生態,它是原數據供給(Data Provision)、數據虛擬化(Data Virtualization)、數據平臺(Data Platform)、數據分析(Data Analytics)的總稱[1],覆蓋從數據搜集、處理、復用、分析到業務洞察等多個層次,是繼網絡服務、應用服務之后,DT(數據技術)時代的核心。高校智慧校園的本質就是數據服務。對于高校數據服務的實施,不僅要面對信息化建設的原始積累,面臨著觀念、方法等門檻的考驗,同樣還要面對其實踐中的一些典型問題。

1校園數據服務之困境

高校從基礎網絡建設到信息系統建設,再到當前愈發清晰的數據服務之大趨勢,這個變化軌跡一方面展現了信息技術的迅猛發展、服務應用的持續擴張,但更重要的是蘊含著諸多高校對于信息化認識的深化與進步,不斷形成帶有時代印記的迭代式的認知基礎,這正是校園信息化發展的根本。

校園數據服務的關鍵是達成數據支撐核心業務的目標,進行“本土化”設計,具有與高校實際業務的黏合度緊、數據服務個性化程度高等特征,這決定了校際間難以有成熟范本可供參照或模仿。同時更棘手的現實問題是,高校面對的多是已布滿業務系統的復雜的信息化現狀,基本不具備擁有“從零開始”的烏托邦式的機遇來重新規劃。數字校園建設之初,高校內運行的業務系統常常是由職能部門各自為戰開展建設,一些業務系統的設計僅考慮了其獨立業務的自身需要,由此形成了不少數據孤島,業務系統之間數據難以共享。業務系統的獨立建設形成了一道道隱形的數據圍墻。由此,我們經常遇到基礎數據重復采集、相近主題的業務數據存在交疊、數據應用缺失等具體現象,對開展全校范圍的數據服務制造了不少障礙。同時,單一業務系統內的數據也出現數據不準確、不完整或更新不及時等情況,由此造成統計分析的數據結果難以使人信服,影響高校決策者的分析判斷。若此類現象出現在跨系統的數據應用時,數據失真可能會進一步放大。數據本身的“公信力”低會嚴重影響高校數據服務的健康發展。

此外,觀念的藩籬也是一道亟待跨越的門檻。近年來,高校的一些職能部門將常規業務數據習慣性地視為私有財產,自我生產和自我消費。在搭建數據接口、開展數據同步等工作時配合度不高。在非保密要求下,甚至還有自建獨立機房的現象。以上情況明顯與“互聯網+”的共享開放等特質不相符合,不僅造成重復投資建設,且與云計算、大數據等新興應用也漸行漸遠。若相關單位能更多、更充分地享受到數據服務的紅利,那么各級決策者才可能逐步形成“數據需從獨享為主逐步過渡為共享常態”的觀念,才可能將各自的業務放到全局性數據服務的大格局下去思考。但現實情況也許是信息化建設的歷史積累難以為大家提供準確、便利的數據服務,而反過來大家也就不易形成打通共享的行動動力。

如何在“數據為大”的時代實現新舊生態的平穩過渡是確需破解的難題。本文從實踐操作層面,嘗試解答在數據服務之路上不可回避的典型問題。

2校園數據服務之關鍵問題與對策

校園數據服務建設主要面臨兩類情景:一類是處理“新”:對于新建業務系統等新需求,采取“充分從既有成果挖掘”的原則,通過在現有業務系統或數據大平臺上增補功能來滿足。即便決定建設,也需按照系統架構、共享接口、數據格式等規范要求下謹慎開展,形成信息化建設全?!耙槐P棋”。另一類是利用“舊”:面對既有的信息化建設成果,從支撐學校關鍵業務的角度入手,集中力量打造少數幾個數據服務試點,以符合數據服務需求的方向進行再規劃與調整,這也是數據服務建設的重點和難點,同樣是化解上述困境的邏輯起點。下文將以數據服務實踐為主線,集中探討第二類情景。

2.1數據資產清理

高校數據往往分散于多個業務系統之中,或常進行業務數據的局部整合。全面“摸清家底”能化零為整,充分利用學校長期積累的數據資產。按業務大類,系統地厘清學校關鍵業務系統及其承載的全部數據資產,形成本校的數據資源目錄,以準確掌握數據資產全貌,數據資源目錄如表1所示。在此基礎上,依據數據資產屬性的邏輯關系,可將其劃分為基礎數據(主數據)、主題數據及部門數據3種類型。其中,基礎數據是高校多部門履職的共同需要,如師生基本信息;主題數據指教務處、學生處等高校核心部門有業務協同需求的數據,如以教學管理為主題的相關跨系統的聯動數據;部門數據是單一部門履職形成的業務數據,如實驗室開放系統所采集的數據。

此外,提煉已建的各個業務系統所能提供的應用服務,按服務對象、內容、局限及服務前置條件等信息項,形成可提供服務目錄,以便為數據服務的規劃提供客觀依據,可提供服務目錄示意表如表2所示。最后,梳理列出能供業務系統使用的校級應用接口及有共享應用性質的數據類平臺。

2.2數據質量關鍵點

許多學者傾向于把數據質量視為一個業務系統表達的數據視圖與客觀世界同一數據的距離,它貫穿于數據全生命周期各個階段[2]??煽康臄祿⑻嵘龜祿谑褂弥械膬r值。面對在用的信息化建設成果,把好數據的入口關是第一步也是最重要的一步,如同于水源。因此,整個校園的數據表示和采集需要按照統一的標準進行定義,以解決可能存在于業務系統之間標準不一致的矛盾。

根據教育部2012年頒布的《教育管理信息教育管理基礎代碼》相關標準,構建數據子集圖并修訂對應的元數據項具體編碼標準,主要包含元數據名稱、數據類型、數據資源格式、取值空間及便于管理的相關代碼標識等[3]。我們在實踐中可先從決定共享互通的基礎數據和主題數據切入與實施。后續各業務系統的建設與調整則需嚴格按照修訂的數據標準執行,防止自行制定相關標準。

其次是針對數據采集問題的再規劃與調整。數據采集是數據質量的入口關,清理出的數據資產是數據采集與再規劃的重要參考。其一,為確保數據的一致性,逐一篩選出多渠道采集的數據項,并確定此數據項的唯一來源的業務系統。其二,分別針對上節三類數據屬性的數據,細分為不同的數據類(這種細分的數據類將作為構建邏輯獨立的主題數據庫的基礎),初步形成以數據類與已有業務系統具有關聯關系的C-U矩陣,矩陣中數據一次一處采集、多次多處使用。新建業務系統需要劃清數據采集的邊界,并不是360度采集每一系統某個業務的全部數據,更不能超出業務范圍采集,而只是采集業務核心數據,相關外圍數據直接從校公共數據平臺中抽取。在用系統則需適當調整功能,重新規劃采集的數據項,去除不必要的重復采集。

2.3數據交換平臺

數據交換平臺是用來對各業務系統產生的公用數據進行收集、存儲及管理,以便各業務系統實現數據共享以及各業務系統數據之間實現交換的公共操作平臺[4]。構建學校全局性的數據交換平臺,它是數據共享的中樞,數據交換平臺如圖1所示。各業務系統與數據交換平臺直接對接,既實現了任意兩個業務系統之間的間接通信,完成了交叉業務系統的數據共享,又使得數據交換集中拉升至全局層面,增強了數據服務的統籌力。高校的數據來源既包含業務系統中的業務數據,也包含線下業務辦理時產生的零散數據。通過業務數據集成接口,將業務系統數據接入,通常使用專門的ETL工具,例如ODI、Datastage、Kettle等。對于沒有業務系統支撐的數據,數據交換平臺提供數據采集模塊,根據需求定義元數據,實現線下零散數據的即時錄入或批量導入。為了充分利用既有的信息化建設成果,對其進行“利舊”,需要對已有信息系統中的數據進行詳細梳理和共享定義,這也再次彰顯出上節“數據資產清理”這一起點性工作的重大意義。

數據接入后需要對其進行清洗和轉換,清洗和轉換的規則由信息標準和上層數據需求共同決定。數據交換平臺同時還要管理數據交換的策略,并對作業進行調度。對共享數據的獲取需求,將由數據中心提供,這降低了數據供需方之間復雜的耦合度,提高了數據的規范性、一致性和準確性。

在實踐中需特別注意的是,數據交換平臺的實施重點在于對信息標準的嚴格貫徹,由于系統建設得有早有晚,也存在工作過程中記錄不規范的情況,所以經常會有數據不標準的狀況出現。我們在利用數據交換平臺接入數據時,需要仔細厘清數據情況,列出與信息標準的差異,并進行清洗和轉換。

2.4主數據及主題數據建設

隨著高校數據中心的建設與發展,主數據和主題數據的建設理念日益凸顯。

主數據是指在整個高校范圍內各業務系統(操作/事務型應用系統以及分析型系統)間要共享的數據。主數據通常需要在整個高校范圍內保持一致性(consistent)、完整性(complete)、可控性(controlled),為了達成這一目標,就需要進行主數據管理(Master Data Management,MDM)[5]。主數據不是所有的業務數據,只是有必要在各業務系統間共享的數據才是主數據,比如大部分的業務處理數據、過程數據等都不是主數據,而像描述核心業務實體的數據,比如教職工、學生、課程數據等都是主數據。高校主數據一般是高校內能夠跨業務重復使用的高價值的數據,這些主數據在進行主數據管理之前經常存在于多個異構或同構的系統中。由于高校內外對數據的需求日益增長,主數據的建設需要有靈活的擴展能力,支持將新的數據注冊成為主數據,以供使用。

主題數據是按照一定的主題匯集多個跨部門業務應用信息而形成,并根據整體業務需求、數據使用頻率等情況,明確數據的邊界。主題數據以數據中心數據為基礎,按照不同的業務主題組織,從而與信息需求相關聯。主題數據應設計得盡可能穩定,能在較長時間內為校園信息資源提供穩定的服務。

3校園數據服務規劃

在打通校內數據孤島,形成主數據庫、主題數據庫的基礎上,校園數據服務將成為建設的主要方向,數據服務基礎框架如圖2所示。校園數據服務分為面向教師、學生、管理者等用戶的上層服務,通過數據質量管理反饋給業務系統的下層服務。

在上層服務中,包括綜合查詢服務、報表服務、統計分析服務、決策支持服務以及數據申請服務。通過統一授權體系,各類數據服務被嚴格規范并清晰控制使用權限,提供給教職工、學生與管理者。

綜合查詢服務以教職工及學生的個人畫像數據為基礎提供,教職工個人畫像包括個人基本屬性信息、工作經歷信息、學習經歷信息、職務信息、職稱信息、科研信息、財務信息、獎懲信息等;學生個人畫像包括學生基本屬性信息、選課信息、成績信息、實踐活動信息、獎懲信息等。

報表服務包括周期性固定上報的綜合型報表,如高基表、教學質量分析報表等;同時也包括校內各部門及管理者工作所需的定制報表,如學生實踐活動參與情況報表、圖書借閱情況報表等。統計分析服務以圖表結合的方式為業務部門及管理者提供各類數據的統計及相關分析、分布分析等。

決策支持服務則綜合數據處理和展示的各種手段,為校、學院、部門各級領導提供綜合的數據儀表盤、數據報告等。數據申請服務使數據需求方能夠自助申請所需的共享數據,得到審批后,其能夠利用共享數據自行定制上述查詢、報表、統計等內容。

在下層服務中,數據服務的對象是各業務系統,通過數據質量管理模塊,定位業務系統數據的質量問題,將結果反饋到業務系統中,從而幫助業務系統進行數據質量改進。

數據服務框架的重點在于抽取定義服務內容,在立足學校辦學定位與發展需求的基礎上,針對業務需求,逐一進行規劃性的定義。而難點在于數據反饋,需要綜合運用技術及管理等手段,將數據反饋納入全校數據治理大框架下,形成一體化的數據生態環境,才能逐步達成校園數據服務的預期效果。

[參考文獻]

[1]聞中,吳桐.數據服務框架[M].北京:中信出版集團,2016:9-10.

[2]蔣東興,付小龍,劉啟新,等.高校數字校園建設指南[M].北京:高等教育出版社,2008:35.

[3]中華人民共和國教育部.JY/T 1002—2012中華人民共和國教育行業標準 教育管理信息 教育管理基礎信息[S/OL].(2012-03-15)[2019-03-01]. http://old.moe.gov.cn/ewebeditor/uploadfile/2012/03/26/20120326163241313.pdf.

[4]李強.關于數字化校園數據交換平臺建設的若干問題研究[D].南昌:南昌大學,2011:6.

[5]趙飛.基于全生命周期的主數據管理:MDM詳解與實踐[M].北京:清華大學出版社,2015:17-27.

(責任編輯白麗媛)

猜你喜歡
數據服務
大數據環境下高校圖書館數據館員建設研究
大數據時代校園一卡通數據分析與應用研究
圖書館數據服務合作開展的博弈策略及保障機制研究
高校圖書館數據素養教育問題與對策研究
一種基于領域本體的數據服務語義標注方法
公共圖書館流通外包管理研究
勝利油田智慧社區建設研究
高分辨率影像服務在國土資源管理中的應用
遼寧省環境數據中心建設探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合