?

基于共詞網絡的教育信息化熱點主題識別與發展態勢研究*

2024-02-27 12:43石道元
關鍵詞:共詞聚類矩陣

石道元

(重慶工商大學 會計學院,重慶 400067)

一、引言

以教育信息化帶動教育現代化,是推進我國教育事業改革發展的重大戰略抉擇。2010年7月,國務院頒布《國家中長期教育改革和發展規劃綱要(2010—2020年)》(以下簡稱《綱要》),《綱要》明確指出“加快教育信息化進程”“把教育信息化納入國家信息化發展整體戰略”。為推進《綱要》對教育信息化建設的總體部署和發展任務,2012年3月教育部發布了《教育信息化十年發展規劃(2011—2020年)》綱領性文件(以下簡稱《規劃》)。因此,非常有必要梳理一下近年來我國教育信息化領域熱點主題及發展態勢。

科學文獻是科學研究成果的主要載體、科學知識傳播的主要媒介,而關鍵詞是科學文獻核心內容的高度凝練體現。因此,利用教育信息化領域文獻集合中關鍵詞共詞分析,可以揭示教育信息化領域研究熱點、主題結構及發展動態[1]。這些年來,很多學者運用多種共詞聚類技術從不同的視角、對象、年限對我國教育信息化研究主題熱點、趨勢進行了充分研究[2][3][4],并取得了豐碩的成果。在傳統主題挖掘分析過程中,各關鍵詞均被視為獨立屬性變量??茖W文獻體系中,各文獻知識元間交叉鏈接,共同構成了節點豐富、交錯縱橫的知識網絡系統,如關鍵詞之間的共現構成了共詞網絡。從網絡分析的視角來看,關鍵詞是共詞網絡中的知識節點,它們之間的“共現關系”不是單個關鍵詞所擁有的屬性,而是共詞網絡系統的屬性。因此,基于常規統計手段(如SPSS等)屬性變量分析并不適合分析共詞網絡關系數據,其研究結果的正確性也有待考證[5]。共詞網絡數據存在網絡各節點之間,表征著節點間關聯、接觸、聯絡及群體依附等關系,適用于分析共詞關系數據的方法是網絡分析[6]?;诖?本文嘗試拓展網絡分析理論并將其應用于教育信息化領域知識結構的探測,以揭示我國教育信息化熱點主題,進而探討其發展態勢。

二、研究設計

(一)數據處理

本文研究數據處理包括數據采集、關鍵詞清理、高頻關鍵詞篩選和共詞矩陣構建四個環節。

1.數據采集

我國的教育信息化最初以“電化教育”形式參與教育教學改革,先后經歷了電化教育、教育信息化、智慧教育等幾個發展階段[7][8]。按文獻內容的學科屬性和特征,《中國圖書館分類法》將“教育信息化”主題文獻歸屬于“G43電化教育”,且下屬劃分有“G431視聽教學(電化教學)”“G432廣播、電視教學”“G433程序教學”“G434計算機化教學”“G436電化教材”等。本研究數據來源于CSSCI數據庫刊載教育信息化研究文獻,限定檢索條件為“中圖分類號=G43電化教育”,期刊年限為“2010— ”,檢索日期為“2020年5月3日”,共返回相關文獻7 600篇。

2.關鍵詞清理

由于部分文獻中關鍵詞命名存在不規范情況,在不影響分析結論的前提下,本文采取了相應規范化處理:① 同義、近義關鍵詞合并處理,如以統一的替代詞“慕課”替換不同表達形式的關鍵詞“MOOCs”“MOOC”,等等;② 專指性不強,含義過于寬泛的關鍵詞刪除處理,如“影響因素”“策略”等。經過上述處理后,將7 600篇文獻題錄信息導入BibExcel進行關鍵詞詞頻統計,共得關鍵詞13 095個,累計頻次31 226次,平均每篇文獻關鍵詞4.11個。

3.高頻關鍵詞篩選

關鍵詞的頻次是衡量其表征研究熱點的能力和重要程度的重要指標。從表1可看出,詞頻大于等于40的關鍵詞有64個,累計頻次總占比17.51%;慕課、教育信息化、信息技術、翻轉課堂、人工智能、學習分析、教學設計、大數據等是時域內教育信息化研究熱點,也是本文研究分析的對象。

表1 高頻關鍵詞統計

4.共詞矩陣構建

利用BibExcel統計高頻關鍵詞在文獻集合中共同出現的頻率,構建64×64的共詞矩陣Aij,如表2所示。

表2 高頻關鍵詞共詞矩陣(部分)

(二)研究方法

本研究主要采用共詞分析、社會網絡分析和戰略坐標分析相結合的研究方法,這樣能更客觀準確地描述和分析我國教育信息化熱點主題結構及發展態勢。

1.共詞分析法

共詞分析作為一種文獻內容分析方法,起源于20世紀70年代,并由Callon、Courtial將該方法引入文獻情報學領域[9]。當兩個能表達某學科領域的主題關鍵詞共同出現在一篇文獻中時,則表明這兩個詞之間存在一定的相關關系[10]。關鍵詞共現頻數越多,它們之間關系越緊密,主題也就越相近。關鍵詞的共詞關系可以用共詞矩陣表示(參見表2),共詞矩陣除可直觀展示關鍵詞之間的關系距離外,共詞矩陣還是開展共詞網絡分析的前提和基礎。

2.社會網絡分析法

社會網絡分析起源于矩陣論和圖論,發端于20世紀30年代的英國人類學研究,旨在對社會行動者關系與結構進行分析。近年來,社會網絡分析的思想和方法逐漸滲透到自然科學和社會科學諸多研究領域,形成了一門相對獨立的網絡科學[11]。作為一種結構主義視角下的量化分析方法,社會網絡分析一方面可揭示知識網絡的屬性特征,如網絡節點中心性等;另一方面還可定量描述網絡社群關系結構,如根據知識節點在網絡結構層面上的對等關系進行主題聚類等。

3.戰略坐標分析法

1988年,Law等人提出通過繪制戰略坐標圖的方法來展現研究領域內部關系及該領域與其他領域間相互影響的情況[12]。戰略坐標圖常被用來描述分析主題聚類的發展態勢[13][14]。戰略坐標圖是以主題聚類內部強度指標“密度”為縱坐標,以聚類間聯系強度指標“向心度”為橫坐標,以橫縱坐標平均數(或中位數)為坐標原點的二維四象限坐標分布圖。在戰略坐標圖中,向心度指標反映了一個主題與其他主題的聯結能力,向心度越大,說明該主題與其他研究主題聯系越頻繁,在整個研究領域中趨于核心地位;密度指標則反映了一個主題聚類的內部聚合能力,密度指標越大,主題內部結構就越穩定,表明該主題研究發展越成熟[15]。

三、研究結果分析

(一)我國教育信息化研究熱點分析

在社會網絡分析中,最常使用的數據處理對象是二值鄰接矩陣,即矩陣中的行和列都代表完全相同的行動者,且排列的順序相同。將原始矩陣Aij轉換成二值矩陣Bij的轉換方法為:計算Aij所有數據平均值(0.898 3),設定共詞頻數臨界值為“1”,當小于臨界值時取值為“0”,反之取值為“1”。將二值矩陣Bij導入Ucinet,可視化結果如圖1所示。

圖1是一個二元無向關系網絡,共包含64個關鍵詞節點、1 532條關系連線。借助共詞網絡社群圖,一方面可以“透視”共詞網絡中各關鍵詞節點位置及節點間的互動,另一方面還可通過點度中心度、中間中心度和接近中心度等中心性指標精確度量節點在網絡中的地位和影響力。

1.點度中心度(Degree)

某點的點度中心度就是該點與其他節點直接關聯數。對于一個擁有n個節點的無向圖,節點i的點度中心度是i與其他n-1個節點的直接聯系總數,其計算公式為:

如果一個點與其他很多點直接相連,就說明該點具有較高的點度中心度,表明該節點居于中心地位。

2.中間中心度(Betweenness)

中間中心度是以經過某個節點的最短路徑數量來表征節點重要性的指標[16]。節點中間中心度愈大,就愈凸顯該節點的中介作用和核心地位。假設gjk是節點j到節點k的捷徑數,點i的中間中心度是節點i處于所有點對的中間度之和,中間中心度的計算公式為:

3.接近中心度(Closeness)

接近中心度測度的是該點與圖中所有其他點的捷徑距離之和,關注的是節點與網絡中其他所有節點的接近性程度。假設dij是節點i到節點j的捷徑距離,接近中心度的計算公式為:

表3列示了各高頻關鍵詞節點中心性計算結果及排序。

表3 高頻關鍵詞節點中心性指標

一個高中心度的節點,會在網絡中擁有更多的資源,并占據著網絡中的特殊位置,而低中心度的節點一般位于網絡的邊緣,在關系的形成過程中是不活躍的[17]。結合圖1、表3發現,慕課、教育信息化、人工智能、教學設計、教學模式、深度學習、學習分析、信息技術、翻轉課堂、在線學習等關鍵詞具有較高的點度中心度、中介中心度和較低的接近中心度,具有較高的影響力,居于網絡中心地位;大學生、網絡教學、教育技術學、混合式教學、教育應用等關鍵詞則以較低的點度中心度、中介中心度和較高的接近中心度處在網絡邊緣位置。另外,較高的詞頻代表了較高的熱度,但較高的研究熱度未必會帶來與之對應的地位與影響力,如大數據、信息技術雖具有較高的研究熱度,但由于與之發生關系的關鍵詞偏少、重要性不夠,這就導致了這些研究熱點在教育信息化領域重要性大大降低;反之,深度學習、在線學習、在線課程、教育公平、智慧課堂等等盡管研究熱度不高甚至很低,但卻居于領域研究的核心或相對重要的網絡位置而具有較高的影響力??梢?社群網絡結構屬性能對節點產生能動影響。

(二)我國教育信息化研究熱點聚類主題分析

在社會網絡分析中,聚類的目的就是把關系性質相似的點歸為一類,而把差別大的點歸為另一類,從而使同類的點具有高度的同質性。目前聚類方法主要有組合式聚類、分區式聚類兩種,前者將點逐步組合聚類,而后者則將大的點集逐步分化。從理論上講,對初始矩陣行(列)的相似性計算及置換不會給矩陣帶來任何信息改變,但這種行為有助于發現矩陣隱含的關系模式。CONCOR作為一種迭代相關收斂算法,它利用Pearson相關系數作為相似性測量,針對矩陣行(或列)間的相關系數進行重復計算,經過無數次的反復迭代計算,最終產生的是一個僅僅由+1(完全相關)和-1(完全無關)項組成的相關系數矩陣。這樣每行/列分裂為兩個類,每個類都由一系列關系結構對等的點構成。從算法上看,可對每個子矩陣繼續無限細分下去,但究竟細分到何種層次,這取決于問題研究分析的層次。通過CONCOR算法迭代計算,初始矩陣重排分區為如表4所示的聚類矩陣。

表4 共詞聚類矩陣

結合表4,可對重排分區的六個主題聚類特征作具體分析。

1.在線學習與開放教育(主題聚類#1)

主題聚類#1是最大的知識聚類網絡,主要圍繞在線學習與開放教育的研究,包含慕課、教學設計、在線學習、網絡課程、在線課程、網絡學習、在線教育、移動學習、泛在學習、網絡教育、高等教育、遠程教育、開放教育資源、開放教育等16個高頻關鍵詞。隨著新技術革命和信息時代的到來,人們的學習方式也在發生巨大的改變,在線學習開始受到社會關注。在線學習即E-Learning,又稱遠程教育、網絡學習、在線教育等,是一種通過應用信息科技和互聯網技術進行內容傳播和快速學習的方法[18]。近年來隨著在線學習的不斷發展與演變,又開始衍生出虛擬學習、移動學習、泛在學習等學習方式。為迎接以互聯網為代表的信息技術給高等教育帶來的挑戰與變革,麻省理工學院通過大規模建設、發布和共享課程資源,拉開了開放教育資源運動的序幕[19]。2015年教育部頒布《關于加強高等學校在線開放課程建設應用于管理的意見》,極大地推進了我國高校數字化教學資源的建設。開放教育資源運動的實踐和推廣也推動了開放在線課程(慕課)在世界范圍內迅速興起。目前,慕課的發展已成為當前高等教育發展新趨勢,勢必會對我國的高等教育產生重要影響[20]。

2.學習分析(主題聚類#2)

在主題聚類#2中,學習分析、教育大數據、大數據、數據挖掘、個性化學習、社會網絡分析等關鍵詞聚集在一起,表明聚類#2主要是圍繞著學習分析的研究。學習分析是通過對學習者、學習環境的數據收集、分析和呈現,從而實現對學習和學習情境的優化[21]。學習分析研究本質是從大數據的角度理解學習,教育大數據為學習分析提供了獨特的機會,使研究者可從與學生相關的海量數據中辨別他們的學習行為發展趨勢,可以更清楚地了解學習者的能力和進步,從而促進個性化和適應性學習體驗[22]。早期的學習分析研究是伴隨線上學習特別是慕課的發展而興起的,如利用在線學習平臺上的學生活動數據挖掘,可以開展學習行為群體特征分析、在線學習投入分析、在線學習質量分析、學習結果預測分析等[23]。近年來,隨著大數據、商業智能及可視化技術在教育領域的持續滲透,學習分析的發展有了更為廣闊的前景,學習分析的方法也從被動潛在的指標分析演變為實時動態學習分析。

3.信息化教學模式與方法(主題聚類#3)

主題聚類#3是關于信息化教學模式與方法的研究,主要包括翻轉課堂、微課、教學模式、混合式教學、教學改革、大學生、知識建構、深度學習、內容分析、自主學習、協作學習等14個高頻關鍵詞。利用信息技術創新教學模式與學習方法,是深化教育改革發展的重要途徑。早期的信息化教學比較重視教學模式研究實踐,強調教師教學設計與策略目標的達成,不太關注學生的學習活動。隨著科技的進步和教育的發展,基于網絡的自主學習開始涌現,能夠統籌線上、線下學習優勢的混合式學習越來越受到社會的關注。與混合式學習不同的是,翻轉課堂教學更加強調課堂外學習和課堂內知識內化提升[24]。翻轉課堂通過重構課堂教學流程,讓學生課前利用微課等學習資源進行自主學習,課堂上由教師組織學生通過小組協作學習等方式展開課堂教學,把學生學習由淺入深地引向深度學習,以提升學習者的知識建構能力[25]。

4.教育信息化理論與實踐(主題聚類#4)

在主題聚類#4中,教育信息化、信息技術、信息化教學、教育公平、教育變革、教育技術、教育技術學、基礎教育、電子書包、互聯網+、云計算、人工智能、智慧教育、智慧課堂、網絡學習空間等15個高頻關鍵詞聚集在一起,表明聚類#4主要是圍繞著教育信息化理論與實踐的研究。教育信息化是指在教育領域全面深入地運用現代信息技術來促進教育改革和教育發展的過程[26]。這些年我國教育信息化理論與實踐均取得了長足的進展,在實現教育公平、提高教育質量、推進教育創新等方面發揮了重要支撐作用。聯合國教科文組織把信息技術應用于教育的過程分為四個階段:起步、應用、融合、創新[27]。在融合創新階段,互聯網+、云計算、人工智能等新一代智能信息技術與教育“雙向融合”,包含了實體空間與網絡學習空間的融合,形成技術沉浸、信息無縫流轉的智慧教育新生態[14][28]。另外,電子書包作為一種教育信息化移動終端設備,迎合了基礎教育信息化的發展要求,促進了學生個性化學習[21]。

5.教師專業發展(主題聚類#5)

主題聚類#5是關于教師專業發展的研究,主要包括教師專業發展、教師培訓、TPACK、信息素養、網絡環境、課堂教學等關鍵詞。教師是教育信息化乃至技術整合的關鍵因素,也是教育變革的自主行動者[29]。而教師培訓是促進教師專業發展的一種有效途徑,教師培訓的有效性直接影響教師信息化教學能力的提升效果及專業發展水平[30]。為全面提升教師信息化教學能力,教育部先后出臺了《關于實施全國中小學教師信息技術應用能力提升工程的意見》(教師〔2013〕13號)《關于實施全國中小學教師信息技術應用能力提升工程2.0的意見》(教師〔2019〕1號)《教師教育振興行動計劃(2018—2022年)》(教師〔2018〕2號)等文件,對提高我國教師信息素養和信息化教學能力起到了重要作用。作為一套符合信息技術時代教師專業發展需要的專業知識體系,TPACK創造性地將技術、教學法和學科內容三種關鍵知識整合起來,為促進教師專業發展提供了新思路。

6.學習環境與學習資源(主題聚類#6)

聚類#6是關于學習環境與學習資源的研究,包括學習環境、學習資源、教育應用、學習科學、虛擬現實、創客教育、教育游戲等關鍵詞。隨著大數據、虛擬現實、智能終端等信息技術的快速發展及學習科學、情境認知、分布式認知等理論在教育領域的興起,為學習環境與學習資源的建設提供了新思路[31]。首先,新信息技術使教育空間拓展為物理空間、資源空間和社區空間,線上線下融合、真實空間和虛擬空間交互的混合式學習空間越來越多地進入學習領域[32]。其次,數字化學習資源趨向多元共創和開放共享,創客教育、STEAM課程等將成重要發展領域。最后,未來的學習設計中兼顧知識性和趣味性,教育游戲環境設計、教育游戲成效、游戲化教學策略等將成新的研究熱點[33]。

(三)我國教育信息化研究熱點主題發展態勢分析

在社會網絡分析中,密度指標可用來測度主題聚類內部及相互之間的連接程度。對于特定的主題聚類而言,密度Dk的計算可以通過該聚類中所有關鍵詞之間(不考慮自相關)共詞頻數的平均值來表示,而不同主題聚類間互動關系密度Dkl可以通過該聚類中所有關鍵詞與其他聚類的關鍵詞之間共詞頻數的平均值來表示,具體計算方法如下:

其中:gk是主題聚類塊矩陣βk中關鍵詞個數,xij表示關鍵詞間共現頻次,gl是塊矩陣βkl中關鍵詞個數,而Dkl是塊矩陣βk與塊矩陣βkl之間關系密度值。

結合表4,各塊矩陣聚類密度計算結果如表5所示。

表5 聚類密度矩陣

表5揭示了所有聚類主題內部及相互間關系緊密情況,如聚類#2密度6.800(賦值關系矩陣密度可以大于1)是密度最高的聚類,表明自身內部成員間關系最為緊密,同時該主題聚類與主題聚類#1、主題聚類#4之間也有著緊密的滲透聯系??偟膩碚f,六個主題聚類內部關系比較緊密,而各主題聚類間關系相對疏遠,說明主題聚類派別表現較為明顯。為進一步揭示各主題聚類的動態特征與發展趨勢,下面對各主題聚類進一步實施戰略坐標分析。

按前面戰略坐標圖繪制方法,主題聚類內部強度指標“密度”值Dk為戰略坐標縱坐標,而橫坐標指標“向心度”Ck具體計算方法如下:

結合表5,可進一步計算出表6所示的各主題聚類向心度值Ck、密度值Dk。以向心度平均值(0.618)、密度平均值(2.569)為中心,通過Excel散點圖的形式繪制出如圖2所示的教育信息化領域主題戰略坐標圖。

表6 主題聚類密度、向心度值

圖2 我國教育信息化領域主題戰略坐標

不同的戰略坐標位置揭示了不同的發展態勢,結合圖2可以對各象限聚類主題進行深入分析。

(1)學習分析(#2)位于第Ⅰ象限的外緣,其向心度、密度都遠遠高于其他主題聚類。作為一個新興的交叉研究領域,學習分析以教育領域數據為研究對象,通過挖掘其背后隱含的信息實現對教育的促進[34],近年來受到了國內外教育研究者的廣泛關注。結合表5、表6可以看出,該聚類主題具有最高的外聯向心度(0.825),與#1、#4等主題聚類保持著密切的聯系,表明當前學習分析研究主要集中在在線學習領域,也是教育信息化領域研究的活躍主題,處于研究的最核心領域;同時,該主題聚類還具有最高的內聚密度(6.800),說明近年來該主題內部聯系緊密,具有穩定的研究方向,研究成果豐富且趨向成熟。

(2)第Ⅳ象限中包括教育信息化理論與實踐(#4)、在線學習與開放教育(#1)兩個主題聚類。近年來,教育信息化與國家發展和技術進步呈現整體上的擬合共振[14],一方面教育信息化發展戰略方向明確,凸顯“互聯網+教育”;另一方面教育信息化發展實踐走向微觀,更加關注信息技術與課程的融合[31]。處于該象限的研究主題具有較高的外聯向心度和較低的內聚密度,表明這兩個研究主題與其他主題聯系緊密,具有較高的關注度;但這兩個主題又存在自身主題內部結構松散,研究不夠充分,研究熱點不聚焦等問題。后面持續的研究過程中,這兩類研究主題很容易分解發展成相關熱點主題。

(3)第Ⅲ象限包含信息化教學模式與方法(#3)、教師專業發展(#5)和學習環境與學習資源(#6)等3個主題聚類。它們的外聯向心度、內聚密度均較低,說明這些研究主題處于教育信息化領域研究的邊緣,與其他研究主題聯系不緊密,受關注度比較少;主題內部聯系松散,或是研究年限較短,或是新研究熱點,發展尚不成熟,有待進一步發展。但需要提醒的是,新出現的熱點多出現在該象限[35]。

四、結語

教育信息化是一項復雜的系統工程,對教育信息化領域研究熱點主題的探測識別一直是教育學界的熱點研究問題。不同于常規統計手段(如SPSS等)屬性變量分析方法,本文基于共詞網絡分析的視角,以近十年來我國教育信息化領域7 600篇高水平學術文獻關鍵詞為研究對象,借助詞頻分析、共詞網絡中心性分析、熱點主題聚類分析及主題戰略坐標圖分析等手段和方法,得出以下結論:

(1)從詞頻統計結果上看,在13 095個有效關鍵詞中,慕課、教育信息化、信息技術、翻轉課堂、人工智能、學習分析、教學設計、大數據等高頻關鍵詞反映了當前教育信息化領域研究熱點,也是時域內我國教育信息化研究的重要分析單元對象。

(2)通過共詞網絡中心性分析發現,慕課、教育信息化、人工智能、教學設計、教學模式、深度學習、學習分析等關鍵詞占據網絡中心位置,具有較高的重要性和影響力;大學生、網絡教學、教育技術學、混合式教學、教育應用等關鍵詞處于網絡邊緣位置,影響力偏弱。進一步的研究表明,較高的研究熱度未必有對等的地位與影響力。

(3)共詞聚類分析結果顯示,當前我國教育信息化領域的六大研究主題是:在線學習與開放教育、學習分析、信息化教學模式與方法、教育信息化理論與實踐、教師專業發展、學習環境與學習資源。

(4)戰略坐標圖分析表明,學習分析得到了教育研究者的廣泛關注,尤其是針對在線學習領域的學習分析研究更是當前教育信息化研究的焦點、核心,且研究已趨向成熟;信息化教學模式與方法、教師專業發展、學習環境與學習資源相比其他研究主題較少被關注,處于邊緣、不成熟的位置,還有待進一步發展;教育信息化理論與實踐、在線學習與開放教育雖受到較高的關注,但研究不夠充分,有待進一步深入研究??偟膩碚f,表征研究成熟度的第Ⅰ、Ⅱ象限中只有1個研究主題,而處于“邊緣、不成熟”的第Ⅲ象限占據了3個,這表明我國教育信息化領域研究總體上處于不成熟狀態,還需進一步探索和研究。

以上研究結論有助于厘清當前我國教育信息化領域各研究熱點主題結構及發展態勢,為我們從整體上把握教育信息化研究提供了重要參考。另外,文中基于共詞網絡結構定量分析的熱點主題識別分析方法,同樣適用于探索其他學科領域的熱點主題及發展態勢,也為相關同類問題研究提供了一種新的研究理路。

猜你喜歡
共詞聚類矩陣
基于突變檢測與共詞分析的深閱讀新興趨勢分析
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
初等行變換與初等列變換并用求逆矩陣
矩陣
矩陣
矩陣
基于共詞知識圖譜技術的國內VLC可視化研究
基于關鍵詞共詞分析的我國親子關系熱點研究
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合