?

基于大數據的高??冃гu估管理平臺

2018-01-10 05:49夏燕
微型電腦應用 2017年12期
關鍵詞:數據倉庫數據挖掘評估

夏燕

(上海市教育評估院,上海 200031)

基于大數據的高??冃гu估管理平臺

夏燕

(上海市教育評估院,上海 200031)

實施高等教育績效評估是優化資源配置和推動高等教育可持續發展的必然要求??茖W有效的高等教育績效評估依賴于全面、可靠的評估數據。大數據能收集大量、多類型的數據,并在深度挖掘和科學分析中,尋求數據背后的隱含關系和價值?;诖髷祿母咝?冃гu估有助于評價從片段化信息的推測轉向基于全方位、全程化數據的科學決策。提出了一個基于大數據的高??冃гu估管理平臺的構建方案,實現了績效評估相關業務的自動化管理,為高等教育績效評估提供了基本依據。

大數據; 數據倉庫; 數據挖掘; 績效評估; 多維分析

0 引言

隨著公共管理體制改革、高等教育大眾化對教育資源需求的膨脹和教育財政性投入的持續增長,高等教育績效逐步成為政府、社會的關注問題。高等教育績效評估是績效管理體系中的核心環節[1]。評估結果作為政府分配教育資源等管理決策的依據,可提高經費使用效益,完善資源配置,促進高校內涵建設和學科優化布局[2]。如何對高校進行系統、科學的績效評估,從而更好地提高資源利用促進高校發展,是目前高等教育研究的重要研究課題。評估指標體系的設計、基礎數據的采集和評估方法的構建是高??冃гu估的關鍵因素。目前,高??冃гu估指標體系和評估方法的研究已比較成熟。隨著高校信息化建設的不斷發展,很多高校都建立和運行著各類不同的數據庫系統,包含績效評估所需的各類基礎數據。如何有效的集成基礎數據,與指標體系相結合進行深入分析,已成為高??冃гu估進一步深化所亟待解決的問題。

大數據技術可以對海量數據進行挖掘分析,提取有用信息,從而指導輔助高??冃гu估。隨著大數據技術在績效評估中的引入,將其從基于小樣本數據的推測轉向基于全方位、全程化數據的科學決策[3]。

本文提出了一個基于大數據的績效評估解決方案,建立了一個高??冃гu估管理平臺。該平臺可運用大數據技術挖掘績效評估數據中隱含著的內在關系,從而促進高??冃гu估的發展,有助于教育資源的合理配置,為教育政策的制訂和改進提供基本依據。

1 相關工作

西方發達國家于20世紀80年代開始開展高??冃гu估,并逐漸將績效評估的結果作為分配教育資源、加強學校管理的重要依據。由英格蘭高等教育撥款委員會(HEFCE)、蘇格蘭高等教育撥款委員會(SHEFC)等聯合組織的英國科技評價負責英國高等教育機構的研究質量[4]。荷蘭大學協會、高等教育學院聯合會等負責對高校進行外部評估[5]。澳大利亞高等教育評估委員會、大學質量署等從不同視角對高校進行績效評估[6]。我國高等教育的績效評估工作從21世紀初正式開展,中央教育科學研究所發布的《中國高等學??冃гu價報告》,對72所教育部直屬高校開展了績效評價[7]。以上各類績效評估主要采用傳統的專家評估法和統計分析方法等相結合,結合投入產出模型進行。但是在評估過程中存在數據支持不足、系統思維缺乏、動態反饋不夠等缺陷。

目前,隨著高校信息化的不斷推進,高校運行著各類系統及數據庫,如教務、人事、學生、科研、財務管理等。各系統提高了工作效率的同時,積累了海量數據。如何將各類數據源與高??冃гu估指標體系、評估方法有效結合,通過對大數據的多角度分析提供豐富有力的決策支持,使績效評估順利實施,已成為目前高等教育研究的熱點課題。

本文基于大數據技術建立了一個高??冃гu估管理平臺,為教育主管部門和高校進行績效評價和制定發展戰略提供基本依據。

2 基于大數據的高??冃гu估管理平臺的實現

2.1 高??冃гu估管理平臺體系結構

基于大數據的高??冃гu估管理平臺體系結構,如圖1所示。

圖1 高??冃гu估管理平臺體系結構

包含5層結構:高校數據集成層、評估指標集成層、績效評估分析層、評估結果反饋層、系統管理服務層。

2.1.1 高校數據集成層

高校數據集成層是高??冃гu估的基礎數據來源,包含分布于各系統的異構數據源。建立異構數據源出發機制后,高??冃гu估所需的數據可增量式地集成到數據倉庫中,確?;A數據的準確性。該層包含數據抽取、數據轉換、數據清洗、數據加載。將異構數據盡可能集成為結構化數據存儲,形成新模式便于與指標體系集成層聯系。

2.1.2 評估指標集成層

評估指標集成層可拆分統一化的高??冃гu估指標體系,以主題關聯、數據集市等方式重構個性化評估指標。由于高校評估對象結構復雜,評估指標往往由若干項指標按照層次關系組成。每項指標包括指標內涵、評估基準、權重、關聯度四方面內容,定量、定性模式等。經績效評估分析后,在評估結果反饋層得到對個性化評估指標的反饋,并依次迭代細化。

2.1.3 績效評估分析層

績效評估分析層通過應用大數據挖掘算法對高校進行績效評估,深入分析評價數據的內在關系,挖掘優勢高校、潛力高校、一般高校、特色高校等各類高校??冃гu估分析層可利用數據云存儲、分布式管理來進行系統體系的融合。

2.1.4 評估結果反饋層

評估結果反饋層不僅包含對高??冃гu估結果的反饋,并且產生的評估結果又包含對前3層的反饋。反饋層通過可視化表現評估結果,識別分析優勢高校,潛力高校,一般高校,特色高校等。對高校建設進行長期跟蹤,觀察其發展情況和進步程度。反饋層通過迭代修正,完善各層的應用。

2.1.5 系統管理服務層

系統管理服務層由2部分組成,平臺管理和數據倉庫管理。平臺管理包含存儲管理、網絡管理、用戶管理和安全管理。該層相對獨立,為其余4層提供了信息的傳遞服務。

2.2 高??冃祿}庫構建

2.2.1 數據倉庫設計方案

由于高??冃гu估管理平臺,涉及各高?;A數據庫,各公共數據庫等,數據內容復雜,信息量巨大,采用自頂向下法建立數據倉庫。集成異構數據源,創建辦學條件與資源、辦學質量與水平、辦學聲譽等若干主題。每個主題可細化為若干子主題,如師資水平、生源質量、國際交流、科學研究、人才培養質量、辦學特色等高??冃гu估所關注問題。在此基礎上,建立數據集市。

2.2.2 基礎數據建模

管理平臺應用星型模型建模,需識別基礎數據中與高??冃гu估相關的最細粒度屬性,根據各主題的需要,建立事實表和維度表,集成異構數據源數據。各主題對應不同事實表,事實表通過鍵與相應的維度表一一對應。

科學研究主題中部分數據模型設計包含事實表,維度表等,如圖2所示。

圖2 科學研究主題中部分數據模型

2.2.3 評估指標建模

考慮到高等教育的多樣化,對不同層次、不同類型的高校進行科學合理的分類,對不同的類別的高校采用不同的評估指標進行評估。設定基礎指標和動態指標,將高?;A數據對應到具體的評估指標。與科學研究主題相關的部分評估指標模型,如圖3所示。

圖3 與科學研究主題相關的部分評估指標模型

高??冃е笜嗽O計需滿足績效評估數據集市所需的最小粒度,指標類型與所屬主題相關聯,弱化區分度小的指標,歸并強相關性指標,正負指標相結合等原則。

2.3 基于大數據挖掘的高??冃гu估

在完成基礎數據建模,評估指標建模后,以事實表為核心,結合維度表和數據加載工具,向數據倉庫提供數據信息??冃гu估管理平臺通過大數據挖掘算法,通過不同的維度對各高??冃нM行評估。

利用分類預測挖掘算法,建立分類函數,將滿足函數條件的高校映射到某個給定的類別,達到預測目標??蓱脹Q策樹算法、樸素貝葉斯算法、貝葉斯網絡算法、神經網絡算法等進行分類預測。

采用聚類分析算法,將各高校進行簇劃分,同一簇的高??冃嗨?,不同簇的高??冃Р顒e較大??蓱没趧澐值腒-means算法,基于層次的BIRCH算法,基于密度的DBSCAN算法,基于網格的STING算法等進行聚類分析。

利用關聯規則挖掘可發現不同高校之間的聯系,推動高校間的合作,提高高??冃???蓱肁priori算法,FP-樹算法等進行關聯規則挖掘。

應用時間序列模式,根據基礎數據隨時間變化的趨勢預測高??冃У陌l展情況。

3 基于大數據的高??冃гu估管理平臺的特點

基于大數據的高??冃гu估管理平臺具有以下特點。

1) 數據采集由靜態轉化為分布式動態采集。評估管理平臺將高??冃嚓P數據,由分布于互聯網的異構數據源動態抽取集成到數據倉庫。確保了評估數據來源的正確性和準確性。

2) 靈活維護評估指標,支持多評估指標體系。評估管理平臺重構統一化的評估指標體系,構建個性化指標。確保被評估對象的整體定位和個體的特性發展。

3) 通過大數據挖掘算法對高??冃нM行多維評估分析。評估管理平臺應用大數據挖掘算法,通過不同維度深入挖掘高校數據內在聯系,對各高??冃нM行評估。確保評估的客觀性和科學性。

4) 由單一數據反饋轉化為雙向互動反饋。評估管理平臺中數據流向由單一模式轉化為雙向互動模式。評估結果對數據流經的各層面各模塊提供反饋。確??冃гu估過程的不斷優化完善。

5) 由結果性評估轉化為過程性評估。評估管理平臺根據主題需求、數據集市,可將過程性數據作為評估主體。不僅關注高??冃КF狀,更注重發展趨勢。

4 總結

在對現有的高??冃гu價方法進行調研分析的基礎上,本文提出了一個基于大數據的高??冃гu估解決方案,構建了一個高??冃гu估管理平臺。該平臺的運用不僅解決了目前高??冃гu估實施過程中存在的不足,而且進一步促進了高??冃гu估的發展。為教育政策的制訂和改進提供基本依據,有助于提升高等教育質量。

在未來工作中,希望根據不同類別高校的特點,進一步開展評估管理平臺中大數據挖掘技術與高等教育數據相結合的研究,對高??冃нM行更科學合理的評價,并進一步推動高等教育管理決策平臺的建設。

[1] Sarrico C S, Rosa M J,Teixeira P N, et al. Assessing Quality and Evaluating Performance in Higher Education: Worlds Apart or Complementary Views [J]. Minerva,2010(48):35-53.

[2] 王奇,馮暉.高等教育績效評估研究[M].北京:高等教育出版社,2012:14-16.

[3] Crossley M. Global league tables, big data and the international transfer of educational research modalities [J]. Comparative Education, 2014,50(1):15-26.

[4] Kitagawa F, Lightowler C. Knowledge Exchange: A Comparison of Policies, Strategies, and Funding Incentives in English and Scottish Education [J]. Research Evaluation, 2013(22):69-74.

[5] H.van den Bosch, Christine Teelken. Organisation and Leadership in Higher Education: Learning from Experiences in the Netherlands [Z]. Higher Education Policy, 2000(13).

[6] Commonwealth of Australia. Our Universities: Backing our Future[R]. Canberra: DEST,2003:42-50.

[7] 中央教育科學研究所高等教育研究中心.中國高等學??冃гu價報告[J].大學(學術版),2009(11):10-29.

PerformanceEvaluationManagementPlatformofUniversitiesBasedonBigData

Xia Yan

(Shanghai Education Evaluation Institute, Shanghai 200031, China)

It is necessary to implement performance evaluation of higher education to optimize resource allocation and to promote sustainable development of higher education. Effective performance evaluation depends on comprehensive and reliable data. Big data technology focuses on deep data mining and scientific analysis based on a large number of multidimensional data, to discover implicit relationship and value among them. It helps performance evaluation of universities from speculation on fragment information to decision making on overall information. The paper proposes a solution of performance evaluation platform based on big data. It implements automatic management for business in performance evaluation. It provides advice and guidance for performance evaluation of higher education.

Big data; Data warehouse; Data mining; Performance evaluation; Multidimensional analysis

1007-757X(2017)12-0003-04

上海市教育委員會上海高校青年教師培養資助計劃(ZZPGY14002),中國科學技術信息研究所ISTIC-Thomson Reuters科學計量學聯合實驗室開放基金項目

夏 燕(1981-) ,女,上海,工程師,博士研究生,研究方向:數據挖掘、高校學科評價、高等教育管理等。

TP181

A

2017.09.21)

猜你喜歡
數據倉庫數據挖掘評估
第四代評估理論對我國學科評估的啟示
探討人工智能與數據挖掘發展趨勢
基于數據倉庫的數據傾斜解決方案研究
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于數據倉庫的住房城鄉建設信息系統整合研究
探析電力系統調度中數據倉庫技術的應用
一種基于Hadoop的大數據挖掘云服務及應用
基于數據倉庫的數據分析探索與實踐
評估依據
立法后評估:且行且盡善
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合