?

人力資源決策支持系統中數據倉庫平臺的設計研究

2017-08-30 10:17劉付成張樹瑜
微型電腦應用 2017年8期
關鍵詞:決策支持系統數據倉庫人力資源

劉付成, 張樹瑜

(上海航天控制技術研究所,上海 200030)

人力資源決策支持系統中數據倉庫平臺的設計研究

劉付成, 張樹瑜

(上海航天控制技術研究所,上海 200030)

在紛繁復雜的人力資源數據信息中挖掘數據并以智能算法生成的各類表層之間的內在關系,通過“加工”實現數據的“增值”,以便及時、有效地提供戰略決策支持,這種方法成為人力資源管理信息系統開發的新熱點。企業建立人力資源決策支持系統,并以此為基礎進行人力資源信息相關大數據的挖掘日益成為企業“現代化產業集團”建立與發展的重要手段。傳統數據管理系統存在與大數據分析架構不匹配、集成性和綜合性較差等問題,而數據倉庫技術在彌補這些缺陷,具有諸多優點。從航天行業人力資源管理信息系統的現狀及特點,分析并構建關于該領域人力資源數據倉庫平臺的實現。

大數據; 數據倉庫; 多維模型; 聯機分析處理; HR-DSS

0 引言

人力資源管理信息系統(簡稱HR-MIS)對管理水平和工作效率的提升作用顯而易見。人力資源管理信息系統就是應用計算機及網絡技術,融合科學、有效的管理方法,輔助人力資源管理從業人員完成信息管理與職能完善的管理模式。人力資源信息包含著龐大的海量數據,不僅有多達數十類不同統計形式的報表數據(如人員基本信息明細、主業人員在崗職工情況、薪酬福利統計信息、員工培訓情況信息、社保繳納情況信息等),并且每類統計數據又包含少則3~5項,多則10~20項的統計屬性。再加上快則每天、每周,慢則每個月、每半年、每年的數據統計信息,形成了“浩如煙?!钡囊訣xcel、Word或.db等文件形式存在的具有重要參考價值的信息。因此,如何從人力資源信息中提取有管理價值的信息,為單位戰略決策服務已經成為各單位乃至其他企業面臨的重要課題。人力資源決策支持系統(簡稱HR-DSS)的建立是解決該問題的唯一途徑。

以作者本人所在的航天單位為例,與國內大型私營企業的人力資源管理信息化相比,大多數航天單位的人力資源管理信息系統處于初期開發階段,存在如下現狀:(1)業務模塊的信息化不完整。先期開發主要集中在員工基本信息、考勤信息、調配信息以及合同信息等模塊,部分模塊還未上線,諸如績效管理、薪酬福利規劃、職業通道以及任職資格管理等模塊還未實現信息化。并且部分上線模塊仍處于試運行階段,隨著信息獲取需求的不斷增加,業務模塊維護的完整性和實效性也存在滯后現象。(2)僅僅具有基本的數據瀏覽或查詢功能。通常是以單一的人事行政事務或人力資源管理業務需求角度設計并研發,雖然目前的系統正在逐漸將模塊功能擴展至單位人力資源管理的整個業務領域,但在系統整體性、前瞻性、集成性、易用性、規范性等方面仍還有待進一步提升;(3)各模塊間生成的信息各自獨立。僅僅通過每個模塊可以了解該業務的基本現狀或情況,由于一個單位運作過程中不斷產生的問題原因涉及到多方面的內因聯系,因此還需要各個模塊信息間的互相支撐或對比分析才能綜合判斷問題及原因。單從個人腦力來進行綜合評價難度很大;(4)無決策增值服務大數據決策支持分析理念。即未真正實現由“人事管理”到“人力資源”管理的轉變,部門的名稱雖然由“人事部”改為“人力資源部”,但工作模式或理念還未完全轉型匹配。面對大量的數據,單位的決策者并不僅僅是瀏覽或知悉,更重要的是發現隱含的內在真正問題,這就需要結合大數據管理方法,對當前單位人力資源狀況進行全面剖析,通過智能決策支持系統識別管理運作中需要改進的風險點,進而利用大數據為領導層全面了解情況、科學決策提供支撐,實現數據的“增值”服務。

進行大數據分析的對象基礎是數據倉庫的建立。數據倉庫不同于傳統的數據庫系統,相比之下存在諸多優點:規模更大、數據集成性和綜合性更高、具有良好的面向大數據分析的體系架構、便于決策者進行長期趨勢的分析和決策、體系結構努力保證查詢和分析的完整、實時性以及努力保證與現代計算機系統的相匹配等。數據倉庫是一種專門的數據倉儲方式,用來保存從多個數據庫或其他信息源選取的已有數據,并為上層用戶提供統一的接口。美國著名信息工程科學家W.H.Inmon[1]提出數據倉庫的概念是:數據倉庫是集成的面向主題的數據庫集合,是用來支持決策功能的,其中每個數據都與時間相關。

本文以作者實際工作單位的人力資源管理信息系統為對象,對數據倉庫的構建進行分析和研究。

1 HR-DSS數據倉庫平臺的設計

按照人力資源管理的實際需求,開發基于數據倉庫的決策支持系統。該系統以Visual Basic為前端開發工具,SQL Server為目標數據庫,主要功能為:多維分析、動態報表、即席查詢、動態預警、可持續預測等[2]。其體系結構,如圖1所示。

圖1 基于數據倉庫的人力資源決策支持系統體系結構

圖1中的數據倉庫是系統的數據管理部分,向上層應用提供所需數據,運用多維分析、聯機分析處理(簡稱OLAP)工具,組成整個系統的核心與基礎。

1.1 數據倉庫平臺的開發方法

數據倉庫的開發過程相當復雜,不同于一般的管理信息系統(簡稱MIS),而是一種數據驅動過程[2],包括數據模型分析、數據量分析、技術環境分析、主題區域分析、源數據分析、物理設計、數據倉庫的建立、數據填充以及決策支持系統等部件的開發。

由于人力資源系統數據倉庫的開發涉及到本單位各部門的大量人員和數據,并需要一定的人力資源管理和信息技術方面的專業知識,因此需要有周密的計劃、科學的管理和有效的方法。數據倉庫的開發分為4個步驟,循環進行,分別介紹如下,如圖2所示。

圖2 HR-DSS系統數據倉庫開發步驟

(1) 信息分析和項目規劃:“企業化、市場化、產業化、國際化”是本單位發展的戰略目標,數據倉庫的建立應該以該戰略為導向進行信息分析和項目規劃,這是保證數據倉庫建立有效的基礎。即,必須明確為什么建立數據倉庫,應該為單位的戰略發展做些什么,并將數據倉庫的建立分為一系列計劃項目;

(2) 體系結構定義:該步驟制定高層次的計劃或藍圖,同樣以本單位戰略發展目標“企業化、市場化、產業化、國際化”為初始定義,確立數據倉庫的技術服務和應用程序結構,并為隨后進行的活動制定更為詳細的計劃;

(3) 實際建立:該步驟的工作包括以現有多種數據存儲形式如Excel、Word、.db等為基礎建立HR數據模型、源系統分析、物理設計、填充實現;

(4) 運行和維護:隨著時間的變化,用戶對信息的需求以及數據的更新需求不斷變化,要求對數據倉庫進行不斷優化并進行適當維護。

1.2 HR-DSS系統數據倉庫的技術體系結構

結合數據倉庫技術和本單位人力資源目前的MIS系統特點,提出人力資源決策支持系統數據倉庫平臺的體系結構,它由以下7個關鍵模塊組成,如圖3所示。

圖3 人力資源決策支持系統數據倉庫技術體系結構

(1) HR數據獲取模塊:其功能是從原來的OLTP數據庫中抽取弱關聯人力資源信息數據,對數據進行檢驗和整理,同時根據數據倉庫的設計要求,對人員信息數據進行重新組織和加工,并加載到人力資源“增值”模塊(簡稱HRM+)目標數據庫中。

(2) 數據管理模塊:用于建立、管理和訪問人力資源數據倉庫中的數據。

(3) 管理模塊:對人力資源決策支持系統數據倉庫的運行提供監控和管理手段,包括人力資源決策支持系統資源的使用管理、用戶操作的合法性管理、安全管理、存儲管理等。

(4) HR信息目錄模塊:為管理者和用戶提供有關元數據。元數據描述人力資源決策支持數據倉庫中源數據和目標數據本身的信息,定義從源數據到目標數據的轉換過程。

(5) 數據訪問模塊:為企業需求分析用戶提供訪問(查詢統計、匯總報表、關聯分析、動態預警、可持續預測等)及分析數據倉庫的工具。

(6) OLAP服務器:是功能強大的多用戶數據操作引擎,特別用來支持數據倉庫中多維數據視圖及服務,體現與OLTP數據庫僅對于傳統事務處理的本質區別。

(7) HR數據傳遞模塊:用于向其他數據倉庫和外部系統分配數據倉庫的數據。

2 HR-DSS數據倉庫平臺設計中的若干關鍵問題

2.1 數據模式的設計

由于OLAP數據倉庫在規模大小、集成程度、集合程度、體系結構等方面與傳統OLTP數據庫有相當大的區別,因此,不宜使用傳統的數據結構,否則無法滿足要求。此外,人力資源數據相關的數據倉庫多維數據使用量大,內嵌引用規律復雜,在智能數據挖掘時會涉及到大量的OLAP操作,如Slice、Dice、Roll-up、Drill-down等。為提高操作效率,有必要為數據倉庫設計一種數據模式。目前構建數據倉庫常用的數據模型有星型模型和雪花模型兩種。雖然星型模型具有查詢效率快的特點,但雪花模型由于采取了規范化和各維度較低的粒度,相比星型模型由于增加用戶查詢處理表數量而導致查詢復雜性相對較高問題,實際中為了得到真正有用的信息,時間花費較多并非考慮主要因素,主要目標是獲取信息的完整性和覆蓋性程度要高,以便獲取對于單位改進或完善管理機制的決策支持。通過對本單位人力資源信息系統統計數據特性的屬性分析,結合數據倉庫環境的特點,我們選定雪花數據模型用于描述多維數據模型。

在多維模型中,人力資源相關信息數據是作為事實和維而不是行和列存儲。雪花模型利用了被稱為事實表的大表,其中包括人力資源的事實數據和數量數據,以及一些被稱為維表的小表,其中包含了描述性數據。一個維表代表了觀察數據的一個角度,可以看作一種測量尺度或立方體的一面。因此,這種模型通常被稱為立方體模型、雪花型模型、事實模型或維模型。如圖4所示。

圖4 HD-DSS分析立方體模型

一個帶有序列、語義屬性和隸屬關系的人力資源變動趨勢分析立方體,一個數據點表示序列、屬性類別和隸屬關系信息的交叉點,如圖5所示。

根據圖4給出圖5所示的雪花數據模式,它由一個事實表和3個維表組成。語義屬性表示該員工的一些基本屬性,包括年齡、學歷、專業技術職務、技術等級及人員類別等;隸屬關系維表列出了員工在不同分類中的特征表述,包括是否內部引進、企業并購、海外引進以及社會引進等;事實維表顯示了員工實際獲得的貨幣及非貨幣性報酬,包括個人職業發

圖5 HR-DSS員工雪花模型

展、提拔晉升、學歷深造以及增值醫療服務等;序列維表通過機構代碼、工號、國密號、身份證號以及與日期ID對應關系的組合來標定人員不同時間的特點索引。這樣事實表通過序列、語義屬性以及隸屬關系三個維表聯結起來,形成雪花模型結構的多維數據模型。

使用雪花數據模型組織多維數據,可以非常直觀的描述多維數據的結構。由于序列維表中數據有限而事實表中的數據龐大,在多維數據進行OLAP操作時,應先對維表進行操作,后處理事實表以提高效率。此外,為提高效率,在進行多表連接時,可利用連接索引(Join Index),不必進行真正的Join運算,就能找到符合條件的記錄。SQL Server就提供這種功能。

2.2 異型數據源的集成方案

數據倉庫的基本思想之一是:當數據從業務系統或其他數據來源取出來時,應該先經過變換或“清洗”。而數據集成是一種較為復雜的數據變換類型,它是指將業務數據從一個或幾個來源中取出,并逐字段的將數據映射到數據倉庫和新數據結構上,這需要元數據的幫助。用于數據集成的元數據一方面定義數據源的原始數據模式與目標數據模式對象之間的映射,即源表與目標表中各字段間的映射,另一方面又規定數據集成程序何時執行數據的轉換和清洗。HR-DSS數據倉庫中的數據集成方案介紹如下。SQL Server的數據倉庫通過ODBC接口可以與多種DBMS連接,為實現異型數據庫之間的數據集成創造了條件[3],如圖6所示。

圖6 通過ODBC連接多種DBMS示意圖

在進行數據轉換的同時,還要去掉源數據中的“臟”數據,即數據清洗。一種清洗方法是檢查數據字段中的有效值,通過范圍檢舉、枚舉清單和相關檢驗來實現。數據清洗規則是各種不同方法的結合。有效值檢驗不要求復雜的邏輯,它既可以用手工編碼的方法,也可以用SQL Server提供的DTS進行數據變換。

2.3 數據倉庫的OLAP處理過程

一個標準的HR-DSS訪問表層生成過程,如圖7所示。

圖7 HR-DSS數據倉庫的OLAP處理過程

前臺控制OLAP Table N Action:它負責接收和處理每個過濾后的數據查詢請求。前臺控制OLAP Table N Action3協調其它控制模塊中的組件分發請求和產生下一個視圖。因為它是一個OLAP Table N Action,它能創建任何類型的內容,包括二進制類型的內容。前臺控制器使用下面的空間完成各種操作:

請求處理類(Filter Request):該類負責映射Request到相應的Action類,使用Table層的Action類使得開發者增加一個新的功能變得很容易;OLAP Action:負責分發EJB Event到EJB Controller(EJB Controller的定義在下面);LANBack:決定請求之后應該跳轉到哪一個表層去。表層流程控制是在外部的各類報表文件中定義的,所以新的表層可以很容易被添加到系統中;EJB Controller用來接收EJB Event和執行相應的EJB Action。使用了EJB Event和EJB Action使得新的業務功能很容易加入到系統中。Filter Request可以放置到前臺控制OLAP Table N Action之前。模板Servlet(Template Servlet)用來組織應用程序中的頁面,來形成統一風格的界面。

4 總結

本文介紹了基于航天領域人力資源決策支持系統中數據倉庫平臺的設計方案、體系結構及若干關鍵問題的解決方法。隨著對決策支持系統研究的深入,構建該系統中還有許多需要研究的地方,例如在此基礎上開發智能數據算法進行有效數據挖掘是進一步需要研究的內容。

[1] 張劍芳. 數據倉庫技術在倉庫管理信息系統中的應用[J]. 實用物流技術,2013,100(1):265-268.

[2] 田永青等. 一種基于稅務系統數據倉庫的模糊數據挖掘算法的研究[J]. 計算機工程與應用,2013,10(2):16-18.

[3] 涂杰,黃志明. 基于數據倉庫的稅務地理信息系統構建[J]. 微型電腦應用,2014,30(11):30-32.

Research on Data Warehouse Platform Design for Human Resource Decision Support System

Liu Fucheng,Zhang Shuyu

(Shanghai Aerospace Control Technology Institute, Shanghai 200233)

It is an increasingly hot topic to provide time and effective strategy decision support in complex and large data mining on human resource information, to generate intrinsic relation among tables and layers and to realize data increment. Data warehouse is an important method to restruct and improve modernization industry group for data mining in human resource management. The traditional decision support systems have many problems such as architecture non-matching, less composition and all-around defect performance. The paper analyzes and establishes the realization of data warehouse platform for human resource management information system combining real present status and characters.

Bigdata; Data warehouse; Multidimensional model; OLAP; HR-DSS

劉付成(1973-),男,博士,研究員,山西朔州人,研究方向:航天器智能控制與大數據研究。 張樹瑜(1978-),男,博士,高級工程師,研究方向:自動化與數據掘。

1007-757X(2017)08-0040-03

TP311

A

2017.06.02)

猜你喜歡
決策支持系統數據倉庫人力資源
護理臨床決策支持系統的理論基礎
基于數據倉庫的數據傾斜解決方案研究
面向知識轉化的臨床決策支持系統關鍵技術研究
基于數據倉庫的住房城鄉建設信息系統整合研究
電務維修決策支持系統研究
讓人力資源會計成為企業的“新名片”
探析電力系統調度中數據倉庫技術的應用
寶雞:松綁人力資源
試論人力資源會計
基于數據倉庫的數據分析探索與實踐
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合