?

基于知識圖譜的國內數字人文研究現狀分析?

2020-04-08 08:47
圖書館學刊 2020年1期
關鍵詞:可視化人文圖書館

陳 琳

(濟寧學院圖書館,山東 曲阜 273155)

數字人文最早起源于人文計算一詞。在深度數字化的時代,人文計算已經不能客觀地反映其內涵,逐漸被數字人文所取代,成為其更恰當的表述[1]。作為數字技術與人文學科交叉的學術領域,近年來數字人文成為國內外熱點研究方向之一,其研究開始于歐美,它的發展推動了人文研究的變革與創新,同時也受到了圖書館界的密切關注。在國內,也取得了突破性的進展,北京大學、南京大學等相繼舉行了數字人文專題研討會與學術交流活動,北京大學從2016 年開始連續三年相繼舉辦數字人文論壇,分別探討數字人文概念、實踐與反思[2]、數字人文與史學研究的互動與共生關系[3]及需求驅動下的數字人文項目;2017 年7 月,南京大學舉辦“數字人文:大數據時代學術前沿與探索”學術研討會[4]。

1 數據來源與研究方法

筆者以中國知網學術資源總庫學術期刊為數據來源,檢索式為“主題=(數字人文)or(人文計算)”,研究的時間范圍限定為2005—2018年,檢索結果為343 條,利用中國知網的“導出/參考文獻”功能導出所選文獻,剔除不相關結果29條,得到有效文獻314篇。

本研究選擇CiteSpace 軟件[5]和中國引文數據庫作為分析工具,采用詞頻分析與引文分析的方法,從所選文獻中提取關鍵詞、作者、研究機構、出版期刊等數據,對國內數字人文研究的整體狀況、研究熱點及前沿趨勢進行可視化分析。CiteSpace是美國德雷賽爾大學陳超美[6]教授開發設計的,本研究采用的版本是5.3.R8.12.30.2018。

2 基本數據統計分析

2.1 發文量年度分析

通過繪制文獻發表的年度分布趨勢曲線圖可以直觀地展示該學科研究領域所處階段、研究發展速度及研究水平[7]。從所選文獻數據中抽取數字人文研究文獻的年度數據,對2005年至2018年所發表的文獻數量進行年度可視化分析,如圖1所示,國內學者真正關注這個領域則是在2005 年之后,特別是在2009 年,王曉光發表論文《“數字人文”的產生、發展與前沿》,首次對數字人文的概念、內容、發展歷史、研究現狀和前沿方向進行了綜合介紹[8],2015年是國內數字人文研究的探索時期,這一時期,國內學者的研究主要集中在國外數字人文應用的項目運作、前沿實踐、技術研究及在圖書館中的服務創新方面;2016年開始,我國數字人文研究開始進入繁榮時期,以北京大學、清華大學、南京大學等高校為首,圍繞數字人文的前沿問題與應用項目,多次舉辦數字人文研討會,將數字人文技術與史學、文學、地理學及藝術學等密切關聯,推進數字人文項目在國內的實踐與創新。

圖1 2005—2018年發文量年度趨勢

2.2 高產作者圖譜分析

文獻作者的發文情況反映了該領域研究的力量分布與活躍程度。圖2 是通過中國知網可視化工具繪制的高產作者發文趨勢圖譜,作者位次不進行區分計算,圖中發文量≥3 的作者有29 名,以第一作者且發表于核心期刊的作者發文量≥4的為鄂麗君、曾子明、夏翠娟,文章發表時間主要集中在2016年至2018年之間,這些國內學者的研究側重于國外案例調研與國內實踐項目研究。鄂麗君以英美高校圖書館為主要調查對象,研究其數字學術支持現狀,特別是研究圖書館協會ARL 成員館的數字學術支持[9],為國內大學圖書館開展數字學術支持提供參考和借鑒[10];曾子明從數字人文視覺資源研究、移動視覺搜索等主題為切入點展開研究[11][12];夏翠娟則是在數字人文項目的建設與實踐中不斷探索,如以上海圖書館的開放數據應用開發競賽為例,提出面向數字人文的圖書館開放數據服務框架[13];關聯數據在上海圖書館家譜數字人文服務中的應用等[14]。

圖2 高產作者發文圖譜

2.3 高產研究機構圖譜分析

圖3 是由中國知網可視化工具繪制的高產研究機構發文情況圖譜,發文量≥9 的研究機構有五家,主要是高校,且以南方院校居多,公共館匱乏,只有上海圖書館一家。自2016 年開始,以上海圖書館為代表的圖書館界也不斷在數字人文的應用中取得實踐性進展,上海圖書館家譜知識服務平臺基于關聯數據技術,重新組織和利用已有的館藏資源和研究成果,實現針對普通大眾的常識普及和智慧尋根服務,針對人文研究學者的知識發現和知識挖掘服務[15]。上海記憶項目之“從武康路出發”利用數據技術,從上海圖書館藏資料中挖掘事實、數據和知識,重現城市在不同時間、空間、視角上的歷史風貌,將不可移動的物質文化遺產與文化記憶資源深度融合,展現城市文化遺產的獨特魅力,同時體現現代圖書館兼具公共性和人文關懷的重要價值[16]。

圖3 高產研究機構發文圖譜

2.4 高產出期刊圖譜分析

期刊登載某一學科文獻的數量反映了期刊對這一學科領域關注的程度,這項數據可以為關注這一學科領域文獻的讀者選擇閱讀期刊提供參考[17]。圖4 是發文量前10 名的期刊及發文數量,歷史發文量最高的是《圖書館論壇》,共計發文30篇。由圖可以看出,前10 名高產出期刊中,除了《山東社會科學》,全部是圖情學科刊物,圖書館是數字人文項目的孵化器,進一步整合人文學者和數字技術工程師的需求[18],國內學者對此深信不疑,并在數字人文的研究與實踐中不斷探索。

圖4 高產出期刊分布情況

3 研究熱點分析

3.1 熱點關鍵詞圖譜分析

高頻關鍵詞是論文中出現頻率較高的關鍵詞,利用CiteSpace 軟件對文獻中的關鍵詞進行詞頻統計、聚類分析,選出高頻關鍵詞并進行分析,可以獲得該領域研究熱點及其發展趨勢[19]。在CiteSpace 軟件中,設置結點類型“Node Types”為“Keywords”,“Selection Criteria”選擇 Top N 為 50,得到熱點關鍵詞的知識圖譜,如圖5所示。

圖5 熱點關鍵詞知識圖譜

該圖包含82 個結點,199 條連線,圖中十字型圖形代表以高頻次關鍵詞為結點的知識聚類圖,字體和圖形大小體現了該關鍵詞的相對熱度。從圖5 中可以看出,國內數字人文研究主要圍繞“數字人文”“圖書館”“高校圖書館”“數字學術”“人文計算”等關鍵詞。樣本文獻中共出現了82 個詞頻≥2的關鍵詞,其中詞頻為5次以上(包括5次)的關鍵詞有18個,如表1所示。

表1 熱點關鍵詞頻次排序

3.2 研究熱點主題分析

通過對關鍵詞詞頻的統計分析,可以得出數字人文研究領域的熱點主題分布,掌握研究主題的成熟度、知識結構、研究的規模等狀況[20]。國內數字人文研究主要包括以下3 個方面的研究熱點主題。

3.2.1 國外數字人文研究的調研與借鑒

數字人文的概念起源于歐美國家,國內學者自2010 年開始不斷調研國外數字人文研究狀況,將國外先進的理念與經驗引入中國,特別是以美國為關鍵詞的數字人文調研性文章有11篇。如朱華順以布朗大學、紐約公共圖書館為例,對美國圖書館數字人文項目進行研究并給出啟示[21];鄧要然等對美國高校數字人文中心進行調研,探究其運營機制[22],并對圖書館領域數字人文項目進行歸類,分析其應用熱點、運行和管理特征[23];鄂麗君通過分析ARL《SPEC Kit350:支持數字技術》調查報告,深入了解北美高校圖書館的數字人文支持現狀[24],給我國高校圖書館以啟示。目前,國內只有武漢大學、北京大學、南京大學三所高校建有數字人文研究中心,這也促使學者們要不斷提高對于數字人文中心建設的關注度。李巧明、王曉光通過對歐美日及中國臺灣的17家數字人文研究中心從項目狀況、人員組成與組織結構、教育職能和活動開展4個方面進行調研,提出數字人文研究中心的發展要堅持項目運作模式,創新組織建設,以教育為本,靠活動助力等建議[25]。趙生輝、朱學芳對國內外高校數字人文中心的建設狀況、模式特征等進行比較分析,提出構建高校數字人文項目資助體系、評價與認證體系以及數字人文領域復合型人才的培養等建議[26],對我國數字人文中心的發展具有借鑒意義。郭金龍、許鑫指出文本挖掘方法是數字人文研究的一個研究熱點與趨勢,并介紹了歐美發達國家文本挖掘應用于數字人文研究的前沿實踐[27];崔春、畢強通過對美國普瑞特信息與圖書館科學學院的關聯爵士項目的項目內容、開發步驟、實現功能等梳理,認為關聯數據技術的出現為數字人文的發展提供了新的機遇[28];張宸等對北美高校圖書館將大數據智能可視化技術應用到數字人文研究、服務數據挖掘、圖書館服務評估進行調查與特征分析,為國內高校數字人文應用研究提供案例借鑒[29]。

3.2.2 數字人文的應用實踐研究

數字人文的應用實踐范圍非常廣泛,從目前國外數字人文研究趨勢來看,應用實踐主要包括歷史學方面的基于GIS的歷史地理可視化,文學方面的文本挖掘與TEI標準,語言學方面的基于大型語料庫的語料庫語言學,舞蹈方面的視頻捕捉、運動分析與虛擬現實再現,以及考古學方面的圖像分析、色彩還原和數字重建等[30]。國內學者關于數字人文的應用實踐研究主要集中在可視化、數字圖書館、數字學術、人文學科、人才培養幾個主要聚類??梢暬垲惏℅IS、文本挖掘、數字史學、古籍數字化等關鍵詞研究熱點,如胡悅融等介紹了文學類文本的“遠距離可視化閱讀”理論與實踐[31];董政娥等在調查中外紡織史文獻資源館藏狀況基礎上,提出從文本挖掘、GIS技術、文本可視化和語料庫4 個方面進行紡織史數字化開發和館藏補給[32];嚴承希、王軍以宋代政治為例,借助符號分析方法對哈佛大學中國歷代人物資料庫進行實證探索與可視化分析,為研究宋代黨爭政治格局提供了一種新的思考方式[33]。數字圖書館聚類包括關聯數據、移動視覺搜索、文本分析等關鍵詞研究熱點,如曾子明、秦思琪結合數字人文視覺資源研究現狀和移動視覺搜索技術研究前沿,構建了面向數字人文的MVS 體系架構,為用戶提供高效的面向數字人文的MVS 服務,拓寬了數字人文視覺資源的研究思路[34]。數字學術包括科研數據、數字學術中心、研究型圖書館等熱點關鍵詞,國內學者對這一聚類的研究主要集中在英美等國外圖書館、數字學術中心等應用實踐的調研總結與分析上。人文學科聚類則是以人文研究、數字媒介等關鍵詞為中心,針對數字人文在文學、史學等人文研究領域的應用方法、實踐探索的研究與探討。人才培養聚類包括數字素養、數字人文教育、學術圖書館等熱點關鍵詞,是近年來新興的熱點研究,我國在有關數字人文教育方面尚未形成系統的運行體系,徐孝娟等國內學者以英美高校為例,從課程方案、課程結構、課程層次和培養目標4 個維度對數字人文課程設置進行透視,結合我國數字人文相關領域的教育現狀,提出數字人文課程及人才培養建議[35]。

3.2.3 數字人文在圖書館領域的研究

數字人文研究的論文分布非常廣泛,涉及多個學科,且呈現交叉跨學科的特點。分布較多的前20 個學科分類如圖6 所示,排在首位的是圖書情報檔案學科,數字人文研究關鍵詞排序中,圖書館也是高頻關鍵詞之一,由此可以看出,圖書館是數字人文研究的最重要的研究領域。無論環境怎樣變遷,圖書館作為服務部門在信息獲取、內容數字化與策展、數字保存以及內容發現與傳播等領域都有著不可替代的關鍵功能[36]。國內學者也深刻認識到圖書館在數字人文研究中的重要作用,在對國外圖書館支持數字人文研究進展、數字人文素養培訓等方面進行調研與借鑒的同時,結合國內圖書館自身資源、技術與服務優勢,在史學方面深度挖掘史學文獻與大規模史料,進行文本化及數據集建設,如國家圖書館的“華夏記憶”項目,北京大學的“中國基本古籍庫”項目,浙江大學的“中國歷代墓志數據庫”等。在語言學領域,在一定規模文本和教學科研需要下進行文本深度挖掘和智能分析,如“全唐詩分析系統”“全宋詩分析系統”等。在人文藝術領域,利用GIS、數據可視化等進行歷史檔案、考古地理資訊及城市發展史等進行分析與展示,如“淡新檔案訴訟關系圖”“宋人與宋詩地理資訊系統”等。

圖6 數字人文研究文章所屬學科分布

4 總結

數字人文是計算或數字技術與人文學科交叉的學術活動領域,它的發展推動了人文研究的變革與創新,成為國內外熱點研究方向之一,同時也受到圖書館界的密切關注。筆者以中國知網學術資源總庫為數據來源,以2005—2018年主題為“數字人文”或“人文計算”的檢索文獻為基礎,借助CiteSpace 軟件繪制知識圖譜,通過對國內數字人文研究文獻進行統計分析與內容挖掘,確定國內該領域的代表作者、高產研究機構及出版期刊,總結并得出國內數字人文研究的熱點主題。目前,數字人文在國內的研究雖然還處于起步階段,關注度卻很高,特別是高校圖書館界,研究范圍不再停滯在最初的國外數字人文研究的綜述性探索,GIS技術應用、文本挖掘、古籍可視化、移動視覺搜索等新的研究主題成為熱點,被更多的國內學者所關注,并逐漸在國內數字人文項目中應用與實踐。在數字人文背景下,圖書館是作為數字學術研究與實踐的拓展空間而存在的[36],圖書館作為信息與資源的集散地,首先,能夠為數字人文研究者提供豐富的資源,也能夠通過整合、標引等,為學者們揭示資源,提供服務支持;其次,為人文學者團隊提供適宜的物理空間與虛擬化的共享空間,成為數字人文項目的孵化平臺;再次,圖書館也將是數字人文的發展強有力的助推平臺,能夠從不同層面上對數字人文理念與項目進行推廣宣傳,促進學術溝通,提升數字人文學科的公眾影響力。與此同時,圖書館參與數字人文項目的研究與實踐也將面臨一定的困境與挑戰,如資源獲取的版權問題、項目建設的標準統一問題、學科館員能力參差不齊等,圖書館人應當保持冷靜的頭腦,對數字人文不要盲目跟從,要合理考慮數字人文項目需求與自身能力,發揮優勢,尋求合作以彌補劣勢,實現共同的目標。

猜你喜歡
可視化人文圖書館
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統
美在山水,魂在人文
最樸素的人文
思維可視化
自然資源可視化決策系統
圖書館
人文社科
去圖書館
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合