馬福祥,馬秀娟,2
(1.青海師范大學 計算機學院,青海 西寧 810016; 2.青海師范大學 藏語智能信息處理及應用國家重點實驗室,青海 西寧 810008)
撒拉族是分布在甘青兩省的一個非常有特色的少數民族,該民族人口稀少、分布集中、只有語言沒有文字[1].因此,撒拉族非物質文化遺產的傳播大多依賴于口頭傳承.一些對撒拉族非遺文化感興趣的研究者選擇用文獻的方式記錄撒拉族寶貴的非物質文化遺產,并旨在通過文獻向世人傳播這一特色鮮明的非遺文化.根據資料顯示[2-5],許多撒拉族非遺文化研究者同時也是撒拉族非遺文化傳承人,他們通過各類文獻資料向人們展示了豐富的撒拉族文化,同時也通過文獻傳播了撒拉族非遺文化,成為了撒拉族文化傳播的中堅力量.
近年來,超網絡理論在現實復雜系統的表示上顯示出了突出的優越性,有效表示了普通網絡無法表示的網絡特性[6-18],為研究者進一步認識復雜系統網絡的特性提供了有效的方法和工具.利用超網絡理論可以深入分析數據之間存在的隱含關系,把數據建模成超網絡,通過對超網絡拓撲性質的分析,可以挖掘出更有意義和價值的信息.目前,通過對相關文獻的分析,還沒有看到超網絡理論在非物質文化遺產領域的應用和相關研究結果.而基于超網絡理論對撒拉族非遺文獻進行建模研究,既可以有效分析撒拉族非遺文化研究中,研究者、研究內容、研究領域間的復雜關系,同時也能發現撒拉族非遺文化研究的專家和傳承人,進一步掌握撒拉族非遺文化研究中的熱點研究內容、熱點非遺文化和急需保護的瀕危非遺文化等.
本文基于超網絡理論,根據收集的撒拉族非遺文獻資料,提出了基于撒拉族非遺文獻的三層混合超網絡,并通過MATLAB進行了仿真實驗,對所構建的撒拉族非遺文獻混合超網絡的節點超度、出度、入度進行了統計分析,獲得了撒拉族非遺文化研究中影響力較大的非遺研究者、熱點的非遺研究內容、熱門的非遺文化領域以及瀕危的非遺文化.通過本文的研究,挖掘出了撒拉族豐富的文化資源,同時也發現了撒拉族文化傳播的中堅力量.此外,本文的研究結果為進一步認識撒拉族非遺研究的現狀提供了參考,對撒拉族文化的有效傳播和保護提供了有價值的應對策略.同時,本文的研究方法可以為其他非遺文化的研究提供借鑒,對推進我國非物質文化遺產的發展有積極的意義和重要的促進作用.
為了挖掘撒拉族非遺文化的研究文獻、研究者、研究內容及研究領域之間的相關關系,本文從知網收集了近30年內有關撒拉族非遺文化的相關文獻數據近800條,研究領域涉及撒拉族的婚禮、籬笆樓建造技藝、服飾、諺語、歇后語、寺院古建筑技藝、皮筏子技藝、駱駝泉的傳說、民歌等文化.通過對數據的清洗和去噪,保留了文獻數據的文獻名稱、作者、關鍵詞、研究領域、出版時間等重要特征.通過對數據的整理,提取有效文獻400篇,作者277人,關鍵詞1200個,涉及的非遺研究領域12類,整理形成原始數據表.
為網絡建模需要,本文從原始數據表中提取文獻編號、作者、關鍵詞、研究領域四個字段,并對作者、研究領域、關鍵詞進行了去重和編號;并利用超圖理論構建了基于撒拉族非遺文獻的多層混合超網絡,文中涉及的概念定義如下:
節點定義:混合超網絡中的節點被抽象為三類,分別是作者節點集AU={a1,a2,…,a277},關鍵詞節點集KW={kw1,kw2,…,kw1200},研究領域節點集RA={ra1,ra2,…,ra12}.
超邊定義:混合超網絡中的超邊也被抽象為三類.第一類是作者超網絡Hau中的超邊HEAU={hea(1),hea(2),…,hea(m)},在作者超網絡Hau中,若多個撒拉族非遺文獻研究者有合作關系,則用超邊hea(x)包含這些研究者.第二類超邊是關鍵詞超網絡Hkw中的超邊HEKW={hekw(1),hekw(2),…,hekw(n)},在關鍵詞超網絡Hkw中,若多個關鍵詞出現在一篇非遺文獻中,則用超邊hekw(y)包含這些關鍵詞.第三類超邊是研究領域超網絡Hra中的超邊HERA={hera(1),hera(2),…,hera(p)},在研究領域超網絡Hra中,若一篇文獻涉及多個研究領域,則用超邊hera(z)包含所有的研究領域.
普通邊定義:混合超網絡中的普通邊定義為兩類.第一類是連接作者節點ai與關鍵詞節點kwj之間的有向邊eij,表示了作者ai研究內容的廣泛性.第二類是連接關鍵詞kwj與研究領域rk之間的有向邊ejk,表示關鍵詞kwj所屬的研究領域rk.
混合超網絡定義:設MH(Hau,Hkw,Hra)表示了一個三層撒拉族非遺文化混合網絡,其中Hau,Hkw和Hra是基于超圖結構的超網絡,三層超網絡之間通過普通的有向邊連接形成一個三層的混合超網絡模型MH.其中超網絡Hau(AU,HEAU)表示了撒拉族非遺文化研究者之間的合作關系;超網絡Hkw(KW,HEKW)表示了撒拉族非遺文獻之間的相關關系;超網絡Hra(RA,HERA)表示了撒拉族非遺文化各研究領域間的相關關系.
為了進一步分析非遺文獻混合超網絡的拓撲性質,本文利用MATLAB編寫仿真程序,根據收集的數據,構建了基于撒拉族非遺文獻的三層混合超網絡,構建過程中的參數及取值如表1所示.
表1 撒拉族非遺文獻超網絡仿真參數及取值
續表
基于數據挖掘的需求,本文結合表1中的各項參數,提出了撒拉族非遺文獻超網絡中各層超網絡建模算法如2.2.1所述,并在此基礎上提出了三層混合超網絡的建模算法如2.2.2所述.
2.2.1 基于非遺文獻的各層超網絡建模算法
(1)作者層超網絡建模算法
step 1:定義二維數組IncMatrix_Ha(N1,N2),用于存儲撒拉族非遺文獻作者之間的合作關系,初始將該二維數組中的所有元素置為0.
step 2:若多個作者合作發表一篇非遺文獻,則用超邊hea(i)連接文獻i對應的所有作者,并在二維數組IncMatrix_Ha(N1,N2)中將文獻i中的作者號對應的列元素置為1.
step 3:重復step2,直到將所有文獻處理完畢,就構建了作者超網絡Hau,圖1是作者層超網絡的示意圖.
圖1 作者層超網絡示意圖
圖2 關鍵詞超網絡示意圖
(2)關鍵詞超網絡建模算法
step 1:定義二維數組IncMatrix_Hkw(N2,N4),用于存儲撒拉族非遺文獻關鍵詞之間的相關關系,初始將該二維數組中的所有元素置為0.
step 2:用超邊hekw(j)包含了非遺文獻j中出現的所有關鍵詞,在二維數組IncMatrix_Hkw(N2,N4)中將文獻j中的關鍵詞對應的列元素置為1.
step 3:重復step2,直到將所有文獻處理完畢,就構建了關鍵詞超網絡Hkw,圖2是關鍵詞超網絡的示意圖.
(3)研究領域超網絡建模算法
step 1:定義二維數組IncMatrix_Hra(N2,N3),用于存儲撒拉族非遺文獻研究領域的相關關系,初始將該二維數組中的所有元素置為0.
step 2:用超邊hera(k)包含了非遺文獻涉及的所有研究領域,在二維數組IncMatrix_Hra(N2,N3)中將文獻j中的研究領域對應的列元素置為1.
step 3:重復step2,直到將所有文獻處理完畢,就構建了關鍵詞研究領域超網絡Hra,圖3是研究領域超網絡示意圖.
圖3 研究領域超網絡示意圖
2.2.2 三層混合網絡建模算法
step1:初始化,定義二維數組AdjMatrix_H12(N1×N4),用于存儲作者和關鍵詞之間的相關關系;再定義二維數組AdjMatrix_H23(N4×N3),用于存儲關鍵詞和研究領域之間的相關關系.初始將這兩個二維數組中的元素都置為0.
step2:在作者超網絡和關鍵詞超網絡之間用普通有向邊進行連接;遍歷數據表,找出編號為i的作者發表的所有文獻的關鍵詞j(j∈KW),用有向邊〈i,j〉連接作者i和關鍵詞j,并將二維數組AdjMatrix_H12(N1×N4)中對應的(i,j)位置上的元素置為1.完成該步驟,就在作者超網絡和關鍵詞超網絡之間建立了連接.
step3:在關鍵詞超網絡和研究領域超網絡之間用普通有向邊進行連接;遍歷數據表,找出關鍵詞j對應的所有的研究領域k(k∈RA),用有向邊〈j,k〉連接關鍵詞j和研究領域k;并將二維數組AdjMatrix_H23(N4×N3)中對應的(j,k)位置上的元素置為1.完成該步驟,就在關鍵詞超網絡和研究領域超網絡之間建立了連接.
完成step2和step3就建立了如圖4所示的基于撒拉族非遺文獻的三層混合超網絡.
本文利用統計分析的方法,對撒拉族非遺文獻混合超網絡的各類度性質進行了分析,包括各類節點的超度、出度、入度等.
本文通過對作者超網絡的關聯矩陣進行分析,獲得了作者超網絡中作者節點的超度序列,通過對作者節點的超度序列進行排序,獲得了撒拉族非遺文獻作者中的活躍者.表2列出了排名位居前20的作者.
表2 撒拉族非遺文獻作者超度排名
從表2中的結果可知,撒拉族非遺文化研究者的超度都比較小,這表明對撒拉族非遺文化的研究成果比較少,說明研究者對這一寶貴的非物質文化遺產的關注度不高.此外,圖5是撒拉族非遺文獻研究者的超度分布.圖中結果表明撒拉族非遺文獻研究者的超度近似為冪律分布,說明在撒拉族的文化研究者中,存在領袖研究者,他們具有較大的超度;這表明,這些作者長期從事撒拉族非遺文化的研究,對撒拉族非遺文化有著濃厚的研究興趣,并發表了相對較多的研究成果,對撒拉族非遺文化的傳播有較大的貢獻,但這樣的研究者數量較少.在該超網絡中,大量作者的超度非常小,這個結果一方面表明大量從事撒拉族非遺文化研究的作者對撒拉族非遺文化沒有持續的研究興趣;另一方面,說明撒拉族非遺文化作為一種非物質文化遺產,還沒有引起研究者的足夠重視.
圖5 撒拉族非遺文獻研究者超度分布圖
圖6 撒拉族非遺文獻關鍵詞超度分布
在關鍵詞超網絡中,節點的超度代表了關鍵詞被關注的程度,也反映了非遺文化研究的熱點內容.圖6顯示了撒拉族非遺文獻超網絡中,關鍵詞節點的超度分布.圖中結果表明:撒拉族非遺文獻關鍵詞超網絡中的關鍵詞節點的超度服從冪律分布,說明關鍵詞超網絡具有無標度特性.表明在撒拉族非遺文化的研究中,存在超度比較大的關鍵詞節點,但大量關鍵詞的超度比較小,說明在撒拉族非遺文化的研究中,出現了研究者廣泛關注的研究熱點,但這樣的研究熱點較少.同時,也表明撒拉族非遺文化的研究內容比較分散,且大部分研究內容不能引起研究者的共同興趣.表3顯示了撒拉族非遺文獻中關注程度較高的20個關鍵詞.
表3 關注度較高的撒拉族非遺文化關鍵詞
在研究領域超網絡中,節點為研究領域,節點的超度代表了研究領域被關注的程度,也反映了在撒拉族非遺文化的研究中,哪種文化更能引起研究者的關注.表4顯示了撒拉族非遺文化的超度.
表4 撒拉族非遺文化研究領域的超度
從表4反映的數據可以看出,在撒拉族非遺文化的研究中,研究者關注較多的是民俗文化,其次是民間文化和民族文化,而對民間舞蹈和民間技藝的研究文獻較少.主要原因如下:
(1)民俗文化和民間文化有著幾千年的發展歷史,并廣泛存在于撒拉族人民的生活中,長期影響著撒拉族人們的生產和生活.研究民俗文化和民間文化有更廣泛的意義和實際研究價值,因此這兩類文化更易引起研究者興趣.
(2)表4數據顯示民族文化是撒拉族非遺文化中被眾多研究者關注的一項文化內容.撒拉族的民族文化滲透到撒拉族生活的方方面面,研究撒拉族的民族文化,可以更好的了解撒拉族人民的思想形態、生活方式等.
(3)數據顯示,撒拉族非遺文獻中對撒拉族民間音樂的研究結果也相對較多,這一結果也表明,音樂在撒拉族人民的生活中占有著重要的作用,表明撒拉族人民是一個熱愛音樂的民族.但撒拉族人民對舞蹈沒有太大的興趣.因此,在撒拉族非遺文獻的研究中,涉及民間舞蹈的文獻最少.
(4)此外,從表4中的數據可以看出,對撒拉族非遺文化中的民間技藝的研究結果也很少,這從側面反映出,隨著時代的發展,撒拉族的很多珍貴的民間技藝正在逐漸被人們遺忘.例如,本文收集到的數據中就缺乏對撒拉族口弦、螭鼓舞等技藝的相關研究結果.
為了進一步分析撒拉族非遺文獻超網絡中各層超網絡之間的相關關系,本文抽取了能反映撒拉族非遺文化的關鍵詞,關鍵詞也反映了撒拉族非遺文化研究的聚焦點,因此通過研究者和關鍵詞之間的關系,可以獲得研究者的研究興趣,同時也能獲得撒拉族非遺文化的研究熱點.
本文在作者和關鍵詞之間建立了有向邊,通過作者的出度反映了作者i所關注的非遺研究內容,也反映了非遺研究者的研究興趣.同時通過關鍵詞j的入度反映了非遺文化的熱點研究內容.此外,本文在關鍵詞和研究領域間也建立了有向邊,通過研究領域層節點的入度反映了某一項非遺研究領域的關注熱度.表5中的數據顯示了各層超網絡中出度和入度排名前10的節點.
表5 非遺超網絡出度和入度排名前10的節點
通過分析表5中的數據,本文獲得了以下結果:
(1)表5中所示的作者(馬偉、馬成俊、王海龍、韓建業、王軍、張連葵、宋衛哲、畢艷君、韓得福、李臣玲)對撒拉族非遺文化有著較為濃厚的興趣,同時這些作者涉及的關鍵詞較多,說明他們對撒拉族文化的研究內容涉及面廣泛,是撒拉族非遺文化傳播的中堅力量,對推動撒拉族非遺文化的傳播起到了關鍵作用.而根據分析數據可知,作者出度值為1和2的作者較多,約有68位,這些作者對撒拉族非遺文化的研究興趣比較單一,但這些作者也應是撒拉族非遺文化的潛在研究者,應該對這一部分作者予以一定的關注,讓這些作者繼續開展撒拉族非遺文化的研究,壯大撒拉族非遺文化研究者的隊伍.
(2)表5中關鍵詞的入度數據表明,排名前10的關鍵詞所表示的研究內容是被撒拉族非遺文化研究者廣泛關注的非遺文化,主要涉及的是關鍵詞有宗教、寺院、村落、民歌、傳統文化、民間文學、花兒等,這些關鍵詞代表的是熱點研究內容.
(3)表5中研究領域的入度數據表明,入度排名靠前的研究領域有民間文化、建筑文化、民俗文化、民族文化、民間音樂、語言文化等,這表明這些非遺文化受到了研究者的廣泛關注,也是撒拉族非遺文化中被重點傳播和保護的文化.但此外,通過數據分析可知,在本文所統計的12類撒拉族非遺文化中,婚喪文化、民間技藝和民間舞蹈這三類文化的入度較少,表明這三類文化沒有被廣泛研究,是撒拉族非遺文化傳播中的瀕危文化.實際上,這三類文化也是撒拉族非遺文化中特色鮮明的非物質文化遺產,特別是撒拉族的民間技藝文化,更是撒拉族人民世代傳承下來的寶貴財富,應加大對這些文化的研究力度,用文獻記錄并傳承這些文化.
本文通過分析撒拉族非遺文化的研究文獻,將文獻的作者、關鍵詞、研究領域抽象為節點,并將文獻抽象為超邊建立了三個超網絡,并通過作者和關鍵詞、關鍵詞和研究領域之間的相關關系將三個超網絡進行關聯,建立了撒拉族非遺文獻的多層混合超網絡.通過分析該多層混合超網絡中節點的超度、入度、出度等拓撲性質,獲得了撒拉族非遺文獻研究中貢獻較大的研究者,同時也發現了撒拉族非遺文獻研究中的熱點研究內容、熱點研究領域以及沒有被關注的瀕危非遺文化.本文的研究結果為進一步深入了解撒拉族非遺文化的研究現狀提供了參考,為制定有效的撒拉族非遺文化保護策略提供了依據.同時,本文的研究方法為我國其他非物質文化遺產的研究提供了新的研究思路.此外,本文提出的基于超圖的多層混合超網絡的建模思想及建模方法可有效挖掘出復雜系統中數據間的相關關系.該方法也可用于分析其他復雜系統的相關性質.