?

省域教學資源公共服務平臺助推職業教育發展機制研究*

2018-12-07 05:25
中國教育信息化 2018年21期
關鍵詞:公共服務教學資源資源

劉 琴

(湖南省教育科學研究院,湖南 長沙 410005)

自互聯網產生以來,其在信息共享與交互層面發揮的作用越來越重要。尤其是進入“互聯網+”時代,互聯網已經成為人類社會必不可少的基礎設施?;ヂ摼W創新成果與經濟社會各領域的深度融合,使得實體領域迸發出了巨大的創新力和生產力,形成了更廣泛的以互聯網為基礎設施和實現工具的經濟社會發展新形態。

在移動互聯網、云計算、大數據、物聯網、人工智能等一系列新技術不斷改造經濟社會活動的同時,越來越多的人開始意識到一個問題:在這樣一個信息爆炸的時代,限制我們思維和表達的阻礙不再是信息匱乏,反而是信息過量,確切地說,是無用無序信息的干擾與過量。

具體到教育領域,教育信息化的概念是在20世紀90年代伴隨著信息高速公路的興建而提出的。自20世紀90年代末開始,我國政府的各種文件已經正式使用“教育信息化”這一概念,并高度重視教育信息化工作。從2012年開始,教育信息化領域的政策集中出臺,2012年3月的《教育信息化十年發展規劃(2011-2020年)》對未來10年的教育信息化建設提供了指導意見和總體方向。2018年4月,教育部印發的《教育信息化2.0行動計劃》(以下簡稱“計劃”)為我們提供了最新的政策保證和工作指南。其中,計劃提出實施的“數字資源服務普及行動”昭示著搭建省域職業教育教學資源公共服務平臺的必要性與迫切性。

一、問題的提出:省級職業教育教學資源公共服務平臺要解決哪些痛點

圍繞著互聯網的飛速發展,信息爆炸或者信息泛濫給人類社會帶來的負面效應和潛在危機日益浮出水面。如何使信息資源得到有效的利用,提高信息的質量,已經成為一個世界性的網絡難題。除了提升個體信息素養,強化自身收集、分析與鑒別信息的能力與效率外,運用最新技術手段,打造資源公共服務平臺也是一個不錯的技術手段。因此,為了助推職業教育的發展,搭建省域教學資源公共服務平臺的意義非常重大。搭建這樣一個平臺,必須要回應互聯網資源獲取方面的痛點,才能精準地把握自身定位。具體而言,互聯網資源具有如下痛點:

1.資源分散

建設主體多元化帶來了資源分散的必然結果。具體到職業教育教學資源層面,除卻以博客、微博、公眾號等形式的個體(團隊)運營資源和以百度文庫、道客巴巴等為代表的大型資源共享網站。職業教育資源相對集中的分布點大致還包括微知庫、智慧職教和國家精品課程資源網等國家級資源庫平臺,超星、網易等多家公司運營的MOOC類網站,還包括世界大學城、省級微課網和學校資源中心等平臺。細細梳理下來,不難發現,這些資源站點還是太多了。

2.資源使用率不高

在互聯網時代,教育資源使用率不高一直困擾著相關部門。即使是國家級層面的資源站點平臺,同樣有著這樣的問題。曾有一個國家級課程平臺,其資源使用排行顯示了這樣的尷尬數據:排名第一的課程,使用達數萬次,但深入研究排名前100位的課程,會發現從前20名左右開始,課程的使用次數低于三位數。這是一個沉重但又非?,F實的數據,也反映出了教學資源使用率不高的現實痛點。

3.資源使用不方便

由于教學資源分散,很自然地產生了資源使用不方便這一痛點。資源使用不方便,主要表現為兩點:一是資源獲取不方便。很多資源站點平臺,對于資源的下載是有限制的,這些限制往往表現為積分和收費的不同形式。二是資源使用不方便。各個資源站點平臺的格式、使用邏輯都不一樣,使得其很難與學校的教學平臺進行系統對接,更遑論教學過程管控和開展數據分析了。

4.資源更新速度難以保證

互聯網教育資源的后續更新維護往往會成為一個非常大的問題,相當比例的資源建成即告完結。其根本原因在于缺少市場化的資源交易機制,單純地依賴財政投入和個人熱情難以確保資源更新的覆蓋面和持續性。

5.資源質量魚龍混雜

在信息爆炸的時代,互聯網資源質量良莠不齊、魚龍混雜是普遍現象。教育教學資源同樣如此,造成這一現象的原因,細究起來大致有三點:一是資源更新速度難以保證;二是資源提供方素養的差別對教學資源質量產生的影響;三是資源平臺機構方對數量的追求更容易實現,而對質量的把控成本缺極高。而這些痛點帶來的現實后果就是高質量的教學資源獲取難度越來越大。

6.資源的知識產權保護形勢堪憂

抄襲、盜版等侵權行為在互聯網時代成本變得更低、途徑相對隱蔽。因此,一些優質教育資源的作者或機構,出于保護自身知識產權的需要,在資源上線方面持謹慎和保守態度。這也在一定程度上限制了優質網絡教育資源的傳播和獲取。

二、解決策略:省級職業教育教學資源公共服務平臺應具備的功能設計

針對當前網絡教育資源存在的痛點,應充分利用大數據、人工智能等先進技術構建省級職業教育教學資源公共服務平臺,從技術和渠道層面解決上述問題。該資源平臺的建設,需要滿足如下功能:

1.資源采集功能

針對當前各類教育資源分散的痛點,平臺應能夠采取必要的技術手段,以較高的覆蓋面采集相關的資源到平臺。在數據采集過程中,各采集頻率需要根據業務需求、數據量大小等靈活制定,可采集的數據類型包括分布式數據信息、關系數據庫中的結構化數據、各種類型的半結構和非結構化數據、靜態及高低頻知識數據等,并且能實現對數據質量進行監控和迭代優化。

2.自動分類與存儲功能

資源采集系統匯聚起來的數據還處于無序、雜亂狀態,甚至其中可能還會存在陳舊過時信息和錯誤信息。所以平臺應能夠針對采集的原始全量數據及增量數據構建原始數據倉庫,實現業務系統原始數據和增量數據的全量數據備份,同時為校內數據積累提供數據存儲。對原始數據倉庫數據清洗及標準化處理,分析適配,形成數據分析表,入庫存儲。對傳統的關系型數據庫,也包括XML等半結構化數據,以及以視頻、音頻、文本和其他形式存在的非結構化數據,將按殘缺數據、錯誤數據和重復數據進行處理,把結果集入庫,并記錄清洗結果,形成標準化數據庫倉庫,最后通過建模分析,針對模型建立模型分析主題數據倉庫。平臺同時提供高效的數據管理及檢索,可通過對數據平臺的授權向外提供數據訪問接口,實現訂閱式的數據共享。

3.自動評級與推優功能

在對采集資源進行分類存儲的基礎上,平臺應能夠通過對用戶的精準分析和對資源的智能識別排序,將適合用戶需求的優質資源及時推送到用戶層面。

4.交易功能

隨著我國經濟社會的不斷發展,對知識產權的保護體系日益完善。尊重他人知識產權、維護自身合法權益的意識在民眾中也越來越普及。作為一個省級的職業教育教學資源公共服務平臺,可以積極探索通過協議支付、在線付費等方式,探索教育資源的交易機制,切實保護原創者的勞動成果,推動優質資源建設的可持續發展。

三、具體方法:省級職業教育教學資源公共服務平臺功能實現的技術手段

為更好地確保省級職業教育教學資源公共服務平臺應具備的功能,必須及時采用較為成熟的技術手段,確保上述功能的有效實現。具體而言,該平臺可采用的技術有:

1.運用大數據爬蟲系統采集處理教育資源

大數據爬蟲系統(爬蟲系統管理平臺)緊跟世界發展潮流,采用目前流行的Python3開發軟件,針對高教行業背景自主研發各類爬蟲腳本,能夠實現全網主題網頁的數據爬取,也能夠完成增量式網絡爬蟲和Deep Web網絡爬蟲。該爬蟲系統管理平臺具有突出的可用性、高可擴展性,能處理PB級別以上的數據,可采集各種類型的互聯網數據,同時具有分布式網絡請求調度以及豐富的頁面結構解析能力,能夠為高校管理、服務、教學和科研方向爬取數據,從而為高校用戶進行海量數據深度分析,并挖掘數據潛在的核心價值。

具體而言,爬蟲系統應該能夠實現下述功能:

(1)通過專業教學資源大數據采集系統,對專業教學資源的大數據進行采集,能夠對各種不同類型的數據格式進行實時數據采集和過濾、去重處理,內置行業詞庫,可自定義。采集數據的速率要能夠滿足專業教學資源大數據平臺的要求。

(2)專業教學資源大數據采集系統需具備本地與云端的聯動能力,共同采集專業教學資源的互聯網大數據,采集范圍包括但不限于教育部網站、世界大學城官網,采集類型包括但不限于微課、課程、素材、培訓等。

(3)對采集的數據能夠進行多種方式的搜索,采集的專業教學資源相關結果可自動排重,結果排重,支持URL的排重方式以及利用內容的相似性進行排重。需具備圖片資源與動態資源的采集能力。

(4)對采集的互聯網數據能夠進行自然語言處理,為存儲和分析挖掘功能做好數據準備。

(5)系統需具備信息檢索、文本挖掘能力,對數據自動分類;對高職教育領域的關鍵詞、關鍵字可單獨分類采集;具備自動計算數據信息熱度的能力并排序,形成關鍵字;對某時間和區域內高職教育行業熱點內容進行統計分析和趨勢預判,給出相應決策依據。

2.運用Sunm-InCenter大數據平臺提供公共服務

Sunm-InCenter大數據平臺采用業內領先技術,基于Hadoop大數據框架進行深度定制開發,結合自研的可視化ETL工具、建模分析、流式處理等核心技術,針對高教行業背景自主研發了企業級智能大數據平臺,是當前是教育行業成熟案例最多的大數據服務平臺。

Sunm-InCenter能處理PB級別以上的數據,可圖形化地采集校內業務系統數據、互聯網數據以及設備日志數據等,同時具有強大的實時和離線計算能力,以及豐富的數據挖掘分析能力,能夠為高校管理、服務、教學和科研方向提供深度的數據處理和高效的計算與挖掘分析。

具體而言,在平臺的實際運營中,大數據管理平臺(框架如圖1所示)要實現下述功能來確保公共服務功能的有效落地:

圖1 大數據管理平臺框架圖

(1)信息處理和存儲

①在數據存儲方面,需提供具有高可用性和擴展性的關系數據庫、列式存儲數據庫、文件系統、內存數據庫等多種存儲系統,以支撐各類業務結構化數據、半結構化數據、非結構化數據、海量實時數據的存儲和訪問需求。

②將采集到的數據完成數據抽取、清洗、轉換、裝載的整形過程。

③為不同專業教學資源大數據應用場景提供不同的存儲方案,將數據加載到不同類型的存儲,例如關系數據庫、非關系數據庫和HDFS文件系統。

④支持按照預先定義好的數據倉庫模型,將數據加載到數據倉庫進行分析。

(2)數據挖掘和分析

①通過數據挖掘引擎完成各種專業大數據的分析,對大量數據進行分布式處理,能夠對采集挖掘的信息和導入的信息,進行進一步的數據分析,根據要求輸出可用信息。

②數據分析引擎須具備以下基本分析呈現能力:信息數據傳播趨勢與路徑分析;具備信息檢索、文本挖掘能力,對數據自動分類;對高職教育行業的關鍵詞、關鍵字可單獨分類采集監控;具備自動計算數據信息熱度的能力并排序,形成關鍵字;對某時間和區域內教學資源的熱點內容進行統計分析和趨勢預判,給出相應決策依據。

③系統能夠滿足大規模數據處理的業務場景,實現海量數據存儲及高性能計算分析?;诜植际郊軜?,通過大規模、可擴展的并行計算框架,對海量數據提供高效的存儲、計算和分析能力。

④提供離線分析挖掘和在線實時分析挖掘能力,可以做到實時分析。

(3)自然語言處理開發包

提供和開放NLP工具開發包,支持完成主流NLP工具包的一鍵部署,提供中文分詞、詞性標注、命名實體識別、依存句法分析、關鍵詞抽取、時間短語識別、情感傾向分析、文本分類、文本聚類、層次分類、在線學習等功能??蛇M行文本分類、聚類、情感判斷、摘要提取、文本去重等中文自然語言的語義分析等功能。

四、機制保證:省級職業教育教學資源公共服務平臺如何避免淪為空中樓閣

省級職業教育教學資源公共服務平臺的搭建與運營,除了平臺自身的技術支撐以外,還需要組織、政策、資金、人員等多方面機制的協同作用,才能夠最終實現其長久的生命力。

1.以先進技術確保資源質量是平臺運營的源頭活水

本文前面充分探討了通過技術手段確保平臺資源能夠有更高的覆蓋面、更快的知識更新速度和更精準的服務推送,這些技術手段的運用,才是平臺長期持續運營的基礎。

2.充分發揮省教科院組織人才優勢是平臺運營的重要保障

作為職業教育領域的教學資源公共服務平臺,需立足于教科院的組織人才優勢,才能確保平臺能夠精準面向適度的受眾和用戶。建設國家級層面的平臺,勢必面臨我國各區域之間職業教育發展不平衡的巨大挑戰。單一城市的公共服務平臺,面向的對象又太少,能夠利用的知識資源也有很大限制,使得投入產出難以取得平衡。而省級平臺的建設,恰恰可以較好地規避上述兩個問題。

3.積極探索公益創業模式,確保平臺運營的長久生命力

所謂公益創業,就是社會組織、企業、非盈利組織等在經營過程中,將社會價值與經濟價值創造性地融合,在保證組織不偏離公益性的同時,借助一些商業手段來實現公益組織的“造血”功能,讓組織擁有更多資源和能力從事公益服務。在本平臺的運營過程中,也可以積極探索公益創業的模式,積極實現“造血”與輸血”的動態平衡,探索知識產權的交易模式,激發資源原創者的積極性,從而實現平臺運營的長久生命力。

五、結束語

職業教育專業教學資源庫是 “互聯網職業教育”的重要實現形式,資源庫建設是推動信息技術在職業教育領域綜合應用的重要手段。我們希望借助大數據平臺采集整合職業教育專業教學資源,并進行分門別類,為職業院校的人才培養和學校建設提供信息化技術支持,并以此為契機,實現“引領專業教學改革,提高人才培養質量的需要”、“實現優質資源共享,專業對接崗位的需要”、“提高‘互聯網+’個性化學習,滿足終身學習的需要”以及“促進中高職協調發展,構建現代職教體系的需要”等諸多目的。

猜你喜歡
公共服務教學資源資源
公共服務
基礎教育資源展示
公共服務
公共服務
公共服務
豐富歷史教學資源 提升課堂教學質量
一樣的資源,不一樣的收獲
資源回收
高校冰上教學資源社會開放的意義及管理模式
資源再生 歡迎訂閱
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合