?

社群認同視域下的iSchools聯盟知識結構探測與社群發現

2024-03-04 02:08胡志偉
信息資源管理學報 2024年1期
關鍵詞:情報學知識結構社群

胡志偉 裴 雷

(1. 南京大學數據智能與交叉創新實驗室,南京,210023; 2. 南京大學信息管理學院,南京,210023)

1 引言

為更好地應對理論與實踐問題日益復雜化的態勢,并面向更加廣闊的社會場景輸送復合型人才,學科整合是當前科學與教育發展進程中的一大顯著特征[1]。20世紀末期,隨著信息社會的高速發展,傳統圖書情報院校在本應迎來機遇時卻面臨學科發展瓶頸與教育危機[2-3],而這也推動相關團體的進一步探索與規劃。經過數年的前期準備,北美地區7所圖書情報學院共同發起iSchools運動,并于2005年以聯盟的組織形式確定下來。iSchools專注于探究信息、技術和人的關系,旨在跳出圖書館、檔案館等傳統機構的既定框架,以更加廣泛的信息領域(Information Field,iField)推動相關學科群的深層整合[4]。它拓展了圖書情報學的發展路徑,也構建了一個體量龐大的多學科社群。截至2021年底,已有13所中國大陸院校加盟,且均具有圖書情報學背景,體現了國內對iSchools運動倡導的發展理念與價值的認同。

iSchools推動了圖書情報學同其他學科之間的互動和融合,但成員背景多樣化的形勢、全盤擁抱技術范式的態勢和過度追捧品牌化的趨勢引發了諸多討論[5-6]。為探究其發展特征,國內外學者從知識結構、組織形態與演進規律著手,跟蹤觀察了iSchools的師資結構[7]、科研成果[8]、專業項目[9]和課程體系[10]等要素。然而,已有研究一方面未深度探究iSchools的知識關聯結構和集群分布格局,另一方面以偏性樣本居多,樣本容量較小。此外,從數據源的視角來看,基于學者研究興趣的實證研究是相關研究中的重要組成部分[11],因為自述研究興趣展現了學者對所屬學科或社群的閱歷認知和價值認同,而當前研究對這一數據源的挖掘程度仍有較大提升空間。鑒于此,本文擬通過深度分析iSchools的學者研究興趣,建構iSchools整體的知識結構,并由此出發挖掘聯盟內部不同社群的發展模式,以期為我國信息資源管理語境下的圖書情報學科建設工作提供參考。

2 相關研究

2.1 社群認同與iSchools運動

社群認同(community identity)理論認為,個體對某一社群的認同過程由類化、認同和比較三個階段組成,即個體選擇將自己編入某一社群,努力尋求該社群成員的普遍特征,并探索自身所認同的社群相較于其他社群的優勢、地位和聲譽[12]。在iSchools的情境下,一所機構若選擇主動加入聯盟,則可認為其認同聯盟的核心理念,且在此基礎上有針對性地發展專長領域;一名教師若長期受聘于某一機構,并探索學科問題域中的若干特定方向,則可認為其能夠形成對學科和機構的客觀認同。iField源于教師和院校的基本社群認同,因而這一知識領域并非漫無邊際,可以凝聚成若干個圍繞社群核心理念而生的穩定主題。當前,學界普遍就iF-ield是圖書情報學的主動轉向,相較于傳統學科具有更高的立足層次[13]、跨學科水平[14]和技術介入程度[15]這一觀點達成了共識,但由于圖書情報學本就是圖書館學和情報學一體化發展而得的整合學科,所以當iSchools致力于“library-library &information-information”演變過程的后半階段時[16],對圖書館要素的取舍態度引發了不少爭議。部分學者證實了“去圖書館化”主張的積極意義[17],但這種態度更多地引起了學界的反對[6,18]。iSchools的核心理念是否得到了貫徹與落實,iField是否與圖書情報學漸行漸遠,仍需進行深入的實證探究。

2.2 知識結構探測與社群發現

知識結構指各類知識相互影響而形成的知識框架[19]。由于知識多以文獻為載體,知識結構探測進而以文本聚類任務為基礎,旨在基于一定規則將文本資料中的零散詞匯聚集并劃分為若干個可解釋的主題[20]。iSchools調研成果中不乏針對學科主題的質性編碼研究,例如,Wu等[21]從25所院校教師的履歷信息中歸納出46個研究方向,史雅莉等[7]基于詞頻統計將研究興趣劃分為9個研究領域、48個研究方向。在成員規模擴大、知識多樣性程度加深的背景下,iSchools內部的社群分化情況成為另一探究熱點。早期研究多從院校名稱或學科背景出發對院校進行直接歸類[22-23],但其效度正日益減弱,因而后續研究多基于網絡分析視角將整體劃分為若干個子社群,如楊思洛等[8]從期刊論文跨學科知識產出與流動的角度出發,將36所iSchools院校劃分為圖書情報、計算機科學、數據科學等六類。

總體來看,相關研究在知識結構探測和社群發現方面取得了豐富成果,但一方面多著眼于碎片化的熱點識別和趨勢預測,較少深入探索知識主題關聯和集群分布格局,另一方面其樣本容量普遍較小,在聯盟發展態勢研判上的說服性較低。因此,本文擬對iSchools全體院校的學者研究興趣文本開展主題識別,借助社群發現算法探測iSchools的知識結構和院校社群,為國內新時期的學科建設工作提供參考與借鑒。

3 數據與方法

3.1 數據收集與處理

截至2021年11月,iSchools官網共登記了123所成員院校。本文制定如下樣本選取標準:①對于院校,逐一調研官網確定iSchools成員身份所對應的具體系別,以避免同一行政單位下其他院系噪聲數據的影響。②對于學者,統一選取教學科研序列的專職教師為樣本。綜合考慮數據的可獲取性,通過三類數據源收集數據,如表1所示。在開展具體工作時,根據優先級對學者的研究興趣文本進行收集,當優先級高的數據缺失或質量較低時,依次用下一級數據進行補齊。③對于社交平臺,依據驗證郵箱或工作經歷判斷其可信度。數據收集時間為2021年11月29日至12月13日,最終數據集包括3311名學者的研究興趣文本。

數據處理工作主要包括三個方面:①利用Google Translate和Small SEO Tools拼寫轉換工具[24],將文本統一為美式英文拼寫;②在R語言環境中整合Smart英文停用詞表[25]和自定義停用詞表,去除無實際意義的詞語;③基于Porter算法[26]對文本進行詞干提取處理,如“organization”“organizes”“organizing”經詞干提取過程后將統一表示為“organ”。

3.2 研究方法

3.2.1 基于LDA模型的主題探測方法

式中,D代表文檔中所有詞的集合,M代表文檔的總篇數,wi代表第i篇文檔中的詞語,P(wi)代表詞語wi在第i篇文檔中出現的概率,Ni代表第i篇文檔中詞語的數量。盡管模型效果與困惑度一般呈負相關,但綜合考慮計算代價和模型效果,多將K值設定為困惑度不再明顯下降時的主題個數。

本文擬基于“主題-詞”概率分布中每個主題下顯著度(saliency)較高的詞語對該主題進行標識。詞語w在主題T中的顯著度的計算公式為:

式中,P(T|w)表示詞語w由潛在主題T產生的條件概率。

此外,根據“文檔-主題”概率分布結果可得到主題T在某一文檔集合中的強度(strength),反映在文檔中的總體比重,計算公式為:

式中,M為文檔總篇數,θi為主題T在第i篇文檔中的后驗概率分布。

3.2.2 網絡構建與社群發現方法

式中,ΘIi代表院校Ii的主題分布向量。依次計算兩兩之間的相似度后,根據院校相似性矩陣構建網絡。為保證研究效度,同樣僅保留權重較大的x2%的邊。

最后,采用Louvain算法[29]展開網絡結構探測。該算法是一種基于模塊度增益計算的非監督算法,一般認為當模塊度Mod滿足0.3

4 研究發現

4.1 iSchools知識主題識別

本文在R語言環境中對語料庫進行3折交叉驗證實驗,并計算困惑度在不同K值下的變化。如圖1所示,當主題數量為25時,困惑度達到較低水平,且此后困惑度隨K值增大的下降程度不明顯,因此選取K=25。參照推薦值,將主題模型的三個主要參數設為α=2、β=0.04、K=25,文檔迭代次數設定為2000。

圖1 困惑度隨主題個數的變化

依據相關指標對25個主題標識并整理后的結果如表2所示,其特征可歸納為:①“信息-技術-人”核心理念得以充分踐行,盡管聯盟涉獵廣泛,但每一主題均聚焦于單一要素或多要素緊密關聯的融合領域;②聯盟從不同角度對信息生命周期給予了重要關注,既有專注于具體環節的內容,也有針對不同介質和場景的信息管理研究;③聯盟注重信息科學與其他學科的融合,在圖書情報學之外明顯涉足醫學、社會學、經濟學、傳播學等多個學科;④聯盟知識分布呈現技術與人文關懷并舉的格局,但“技術”型主題在數量和強度上明顯占優。

表2 iSchools聯盟知識主題標識、強度與高顯著度詞語

4.2 iSchools知識結構探測

基于主題在文檔中的共現關系所得的知識主題網絡如圖2所示(x1=20,Mod=0.32)。圖中,節點代表主題,大小代表強度,內部標簽為主題編號,虛線框代表主題類(TC1-TC4),邊代表兩個主題之間存在著顯著的共現關系。綜合考察主題類的內部構成,可以發現:

圖2 iSchools聯盟知識結構及其探測結果

(1)TC1是iSchools的跨學科前沿陣地,如“健康與醫學信息學”(T2)是信息科學方法論引入醫學的產物。盡管這些跨學科主題可能在內容上交集較少,但探測結果證實了它們之間具有顯著的關聯。此外,TC1社群的強度顯著較高,擁有強度前7位中的6個主題,可見在iSchools聯盟踐行核心理念的前提下,多門傳統學科的交叉領域已然成為其研究主陣地。

(2)TC2代表著圖書情報學的傳統研究主題,緊密圍繞信息鏈和信息資源生命周期展開。在iField框架之下,圖書情報學的傳統知識領域有了進一步的補充與拓展,且仍聚合在同一主題類中。這一集聚現象并不意味著圖書情報學的固步自封,如位于社群邊緣的“信息行為與素養”(T9)、“信息計量與評價”(T21)和“數字信息管理”(T22)等主題仍和外部主題有著深度互動。

(3)TC3具有深厚的信息技術特色,同計算機院校陸續加盟、信息技術領域學者數量增加的實際情況密不可分。TC3與其他研究領域之間存在相當程度的聯系,且不同方向的信息技術常被應用至不同類型的研究場景中,如“信息計量與評價”(T21)研究常使用關于“數據挖掘、分析與可視化”(T14)的方法與技術。

(4)TC4為典型的人文信息學研究方向主題類。主題類內部僅有“公共文化與文化遺產”(T10)與外部主題有較強聯系,涉及的主題包括“信息存取與共享”(T3)、“社交媒體與社會議題”(T4)、“圖書館與信息服務”(T5)以及“數字信息管理”(T22),這可能受相關學者規模較小的影響。TC4主題類對圖書、檔案等傳統文獻給予了重要關注,并致力于以此提升人類的文化素養,推動人類文化的發展。

綜合觀察四類知識主題的內涵及其在整體網絡中所處的位置,一方面,“信息-技術-人”框架下的研究主題是當前聯盟所關注的主體內容。圖書情報學的傳統研究主題是三個要素交叉領域中的重要組成部分,集聚為TC2主題類;經濟學、傳播學和教育學等其他學科,或圖書情報學深度參與、但需多學科整合的領域,集聚為TC1主題類。另一方面,信息技術和人文學科分居兩側,分別構成了“信息-技術”二元主題類(即TC3)和“信息-人”二元主題類(即TC4)??傮w而言,iSchools的知識結構呈現了顯著的跨學科特征,而圖書情報學因自身研究域與iField三元模型的契合,不僅在其中扮演了主體角色,也發揮了聯結其他知識模塊的重要橋梁作用。

4.3 iSchools院校社群發現

基于“院校-主題”分布所得的院校相似性網絡如圖3所示(x2=10,Mod=0.43)。圖中,節點代表院校,標簽為院校名稱,節點及其標簽的大小代表樣本學者數量,虛線框代表院校所屬社群(IC1-IC4),9所離群點院校未展示。為對各個社群進行識別與歸納,本文從知識主題和地區兩個視角分析社群內部成員的分布情況。

圖3 iSchools院校相似性網絡社群發現

在知識主題分布方面,4個社群的分布情況如圖4所示。IC1和TC3、IC2和TC2為高度對應組,前者的技術色彩較重,后者更具圖書情報學傳統。IC3和IC4的高強度主題集中分布于TC1主題類中,其區別主要體現在兩個層面:①融合學科不同,IC3注重同醫學、經濟學、教育學等學科的整合,而IC4更多對社會學、傳播學、藝術學等學科持有濃厚興趣;②對信息技術的關注度不同,IC3比IC4更加關注TC3的技術型研究主題。

圖4 iSchools院校社群的知識主題分布

在地區分布方面,4個社群的分布情況如圖5所示(地區分類來源于iSchools官網)。除IC1中的院校外,社群和地區之間存在著不同的對應關系:①19所亞太院校屬于IC2社群,占25所亞太院校的76%;②北美和歐洲院校呈現相當程度的偏態分布,均有近60%的院校分別位于IC3和IC4社群中。鑒于圖書情報院校是iSchools的構成主體,且技術色彩濃厚的計算機院校集中分布于IC1社群內,因而可以初步確認不同地域的學科特色是造成社群分化現象的重要原因。

圖5 iSchools院校社群的地區分布

綜合上述分析,本文對iSchools聯盟的社群發現結果做出如下推論:

(1)IC1社群為信息技術(Information Technology,IT)模式,社群成員以計算機院校為主,同時包含少許技術背景較為深厚的圖書情報院校。社群成員對信息技術具有較高的采納態度,TC3類主題強度顯著較高。社群成員間沒有明顯的地域差異,這說明無論位于哪一地區,選擇加盟的計算機院校對信息技術的關注范圍和程度有著高度的一致性。

(2)IC2社群為圖書情報與檔案管理(Library,Information and Archives Management,LIAM)模式,亞太院校構成了社群主體。社群成員深深扎根于圖書情報學的傳統陣地中, TC2類主題強度顯著較高,對“檔案、圖書與出版”主題也具有較高關注度。

在以中國為首的亞太地區,檔案學、出版學等學科一般仍以單獨學術單位的形式存在,而這也確保了院校內部有足夠多的學者從事相關研究。

(3)IC3社群為多學科信息研究(Multidisciplinary Information Studies,MIS)模式,以北美地區最為典型。知識主題分布情況相對均衡的態勢表明,社群在致力于建構廣義信息研究域的同時,并未放棄圖書情報學的傳統研究。社群成員對“健康與醫學信息學”“技術經濟與組織發展”“教育學與心理學”等主題的關注程度較高,即傾向于選擇醫學、經濟學和教育學等學科進行整合。

(4)IC4社群為人文型信息研究(Humanities Information Studies,HIS)模式,以歐洲地區最為典型。社群成員對人文學科持有相對較高的關注度,著重強調“公共文化與文化遺產”“信息傳播、政策、法律與倫理”“藝術與多媒體設計”等主題,向信息科學中注入了哲學、博物館學、美術學等具有明顯人文特色的學科。事實上,歐洲許多iSchools院校隸屬于人文學院,深厚的學科基礎和獨特的機構形式合力提升了人文學科在社群研究中的參與度。

5 討論

5.1 iSchools的社群認同與“去圖書館化”傾向

研究發現,當前iSchools的知識主題在“信息-技術-人”核心要素的組建方面存在差異:①TC1和TC2是三要素的交匯前沿,分別代表多學科綜合發揮作用的領域以及圖書情報學的傳統研究主題;②TC3主要關注信息和技術兩個要素;③TC4更多體現為信息和人兩個要素的參與。不同院校對知識主題采納度的差異體現了其對要素間關系的不同理解,如計算機院校作為IC1社群的主體,更多傾向于以技術為核心要素,而其余社群更多在綜合調用三個要素的平衡作用。這一現象說明,“信息-技術-人”框架作為iSchools的初步社群認同是可行的,與圖書情報學的發展脈絡高度契合,可以進一步深化圖書情報學的“文獻傳統”和“計算傳統”[31],但其要素作用機制仍需進一步探索。近年來,國內提出以新文科建設推動多學科的交叉融合以及多機構的協同共享,國內院??筛鶕陨韺嶋H情況,在iField框架下同相關學科充分深入整合,構建外延可解釋性高但內核明確的多元學科體系,加強交叉研究促進機制的建設工作。

“去圖書館化”問題是iSchools運動中的討論焦點。研究發現iSchools內部仍有許多致力于圖書館學研究的學者,集中體現為“圖書館與信息服務”主題,其強度位居第5位,但考慮到圖書情報院校本就是iSchools的最大成員來源,主題發現結果的確未達預期。與已有研究[7]相比,圖書館事業方向的比重顯著降低,而致力于數據科學、計算機應用方向的學者數量明顯增加,“去圖書館化”傾向在學者研究興趣方面得到明顯體現。然而,在知識網絡中,“圖書館與信息服務”主題和“政企信息資源管理”“信息查找、搜索與檢索”“數字信息管理”等主題之間的聯系均較為緊密,鑒于本文的知識結構是基于共現關系而得的,可以認為,圖書館要素被融解并吸收進了信息資源管理生命周期中,和政府、企業等信息泛在環境一同成為信息研究的重要行業或場所。在這一過程中,圖書情報學的許多研究已跨出了圖書館的場景范圍,促成了相關學者隨iField的理想架構路線上溯或轉移的情況。為避免這一現象最終惡化為學科根基的分崩離析,國內院校亟需明確學科內核、塑造一級學科認同,同時保持自信和開放的心態,同其他學科一起就廣義信息研究域中的問題展開交流與合作,以邏輯自洽拓展學科生存空間。

5.2 圖書情報學科建設的地區特色

學科建設工作具有目標明確、體系清晰的戰略意義。社群分析結果顯示,全球范圍內的圖書情報學科具有鮮明的地區特色:①LIAM模式基本對應亞太院校,其中尤以國內院校居多,致力于同檔案學、出版學等學科實現有機融合;②MIS和HIS社群分別以北美模式和歐洲模式為典型,前者更多持有醫學、經濟學和教育學的整合視野,后者扎根于深厚的人文學科基礎開展信息研究。圖書情報學的地區分化現象和信息技術型院校集聚的現象形成了鮮明對比,不僅體現了各院校因地制宜的“本地邏輯”,也在一定程度上表明了不同地區的學科主體對內核和外延界定的差異。對于國內相關院校而言,既可以參考歐洲模式加強數字人文方向的教育與研究,通過人文學科與計算技術的整合促進信息研究的發展,又可以參考北美模式探索全方位、多樣化的學科整合進路,推進數據科學、健康信息學等交叉領域的同步建設。在以國外學科建設經驗為藍本的同時,國內院校也應結合自身實際情況發展學科特色,實現對“政企信息資源管理”“信息行為與素養”“信息與知識組織”等代表性主題的鞏固與加強。

6 結語

蘊含社群認同的知識體系是學術社群內部得以緊密聯系的關鍵根基,而一個在堅守學科內核前提下更加開放而多樣的環境更是學科健康穩定發展的重要補劑。本文基于學者研究興趣文本,通過主題模型和社群發現算法將iSchools的截面知識結構劃分為4大類、25小類,并識別分析了4種iSchools院校發展的典型模式。研究發現,iSchools的知識結構緊密圍繞“信息-技術-人”核心理念而展開,圖書情報學在其中扮演了重要角色,既深度參與了許多跨學科問題的討論,又發揮了聯結信息技術和人文學科兩大知識模塊的重要作用。聯盟整體的“去圖書館化”傾向客觀存在,而內部的集群分布現象實質上反映了不同地區圖書情報學科建設的特色。對于正值信息資源管理轉型期的國內院校而言,應回歸學科初心,在學習國際先進經驗的基礎上構建具有中國特色的學科知識體系,切忌與圖書館、檔案館等直接相關業界機構解綁,完全脫離圖書情報學的傳統土壤。同時,應主動融入學科開放、合作與競爭的時代洪流中,以理念創新推動角色轉變,以交叉整合探索學科藍海。

本文從社群認同視角出發,探究了當前時間窗口下iSchools的知識結構和集群分布情況,具有一定的理論和實踐價值,但仍存在不足之處,如研究興趣文本的數據質量難以控制,而靜態數據也限制了知識結構的歷時性分析。后續研究可進一步豐富并改善研究數據,并繼續以全球和縱貫視野探索學科和機構的動態演化路徑。

猜你喜歡
情報學知識結構社群
開放與融合:公安情報學進入情報學方式研究*
把握核心概念 優化知識結構
構建中國特色的情報學
我國正當防衛研究的網絡知識結構與核心脈絡
社群短命七宗罪
概率統計知識結構與方法拓展
基于九因子模型的新手教師TPACK知識結構分析
母嬰電商的社群玩法
VC靠邊!社群股權眾籌來了
天使進化——VC靠邊!社群股權眾籌來了
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合