?

映射之難
——人文社科學科評價中跨庫數據的學科歸屬問題*

2023-08-08 09:32郝晉清
圖書館論壇 2023年7期
關鍵詞:學科分類社科人文

張 蒂,郝晉清,王 珺

0 引言

在推進“雙一流”建設進程中,高校圖書館積極開展學科評價服務。這項服務依托圖書館數字資源,應用文獻計量法及分析工具對多源數據進行整合分析,通過不同評價指標實現對特定機構的學科競爭力評價。由于學科評價的基礎數據來自不同數據庫,而每個數據庫獨特的文獻分類體系與確定評價學科所依據的教育部學科分類體系并不一致,因而如果無法將獲取的數據與評價學科進行匹配,就會降低數據準確性,直接影響評價結果的合理性。因此,科學判別數據的學科歸屬成為學科評價中亟待解決的重要問題。對人文社科學科評價而言,研究對象復雜化、研究范式多樣化、學科成果多元化等特點決定了評價體系是綜合性的系統工程[1],不僅評價指標的設定與自然科學學科有所差異,而且評價數據的來源也必須是多維的,除應用國際權威的引文數據庫外,還要充分應用其他可行的中文數據庫源[2]。多源異構的跨庫數據和學科本身的復雜性,為人文社科評價中學科歸屬的判別帶來了更多挑戰。

跨庫數據的學科歸屬問題直觀地表現為應用數據庫獲取學科數據時比較困難,這也促使業界積極從構建數據庫的映射方案層面著手解決此類問題。目前已有的數據庫映射方案集中于WoS、ESI和Scopus等外文數據庫,而缺少對CNKI和CSSCI等數據庫的探究和分析,這無疑是人文社會科學評價中實踐研究成果層面的缺失;同時由于缺少從映射方案中提煉出的可借鑒的方法和策略,從業者面對來自不同數據源的學科判別問題時仍然顯得辦法不多。在理論層面,雖然學界對學科分類及映射原理早有研究,但相關研究成果沒有與多維數據庫的學科歸屬判別情境發生鏈接,無法為解決實踐問題提供更多的理論支持??梢?,針對人文社科學科評價中判別跨庫數據學科歸屬過程中所出現的理論與實踐脫節、數據庫實踐范圍不完整以及缺乏從業者可借鑒的應用策略等問題,進行有針對性的研究并提出合理解決策略勢在必行。本研究聚焦人文社科學科評價中跨庫數據的學科歸屬問題。應用案例研究法全方位地展示了南開大學圖書館在開展人文社科學科評價進程中,根據數據庫特點及映射理論,在辨析學科分類體系的基礎上,通過制定多維度的學科映射方案對來自CNKI、CSSCI和WoS等數據源的評價數據實現合理判別學科歸屬的實踐過程?;诎咐龑嵺`,本研究全面剖析了學科評價中跨庫數據學科歸屬問題的本質及根本原因、解決途徑及制約性因素,并提出了包括情境性因素、映射思路和實踐方法在內的應對策略。

1 研究現狀及述評

1.1 理論基礎梳理

(1)關于學科分類的內涵及分類體系的對比。有學者[3-5]從范式發展或認識論視角研究學科分類,認為學科分類是為了確定學科在整個科學體系中的地位,根本問題是按照原則揭示體系的內在關系,并以嚴格的符合邏輯的排列形式進行表述[6];也有學者注重分析不同分類體系之間的差異,如對比國內外學科分類體系[7],指出我國人文社科學科分類體系的問題并提出新的分類框架。

(2)關于學科映射方法的探究。學科映射方法是解決數據學科歸屬問題的理論基礎。在信息學研究中,映射指建立一個或多個詞匯的概念與另一個詞匯的概念之間的關系[8]。人工映射和自動映射是常見的兩類分類法映射方式,人工映射一般通過領域專家對映射類目集進行對比分析;自動映射是指用計算機通過統計或設計利用相關算法對類目進行映射[9]。詹萌論證了學科分類與文獻分類之間進行映射的可行性[10],提出多種映射方案。這些基礎理論和學科映射方法的探究為解決數據庫的學科歸屬判別奠定了理論基礎,提供了方法論上的指引,但具體的映射方法還要根據評價情境進行合理構建。

1.2 實踐策略分析

(1)剖析學科評價實踐中凸顯的數據的學科歸屬難題。開展學科評價服務是近年高校圖書館在“雙一流”建設大背景下的重要服務模式,很多從業者就實踐中凸顯的學科數據判別問題從不同層面進行了分析。吳愛芝等[11]根據北京大學開展的學科競爭力評價實踐,提出數據的學科匹配與歸屬是評估中需要解決的重點問題。趙飛等[12]指出大部分科研成果的學科劃分均是參照來源數據的學科劃分來定義,由此產生的問題和誤差也是科研評估中無法回避的難點。謝慧珍[13]以天津師范大學的實踐為例,指明數據的權威性和廣泛性是進行數據源選擇的重要考慮因素。

(2)提出針對特定數據庫的學科映射方案?;趯嵺`,許多學者對特定數據庫進行了有針對性的映射研究,為學科數據判別提供了有參考價值的實證案例。陳雨[14]應用分類體系差異測度工具,全方位地比較了WoS和Scopus分類體系的差異;劉苗苗等[15]基于ESI工具進行了社會科學總論學科域的映射研究;付凱麗[16]在對制約學科評價服務的多種因素的分析中提出正確利用數據庫分類體系是全面準確獲取數據的前提,并以心理學為例建立了WoS及Scopus的學科映射方案。

1.3 研究現狀述評

綜上,雖然學界和業界已經注意到了學科歸屬問題給學科評價實踐帶來的影響,并通過制定針對特定數據庫的映射方案,為解決數據獲取層面的難題提供應用依據,但理論研究的缺陷及實踐中亟待解決的問題仍舊存在。首先,缺乏關于CNKI 和CSSCI 數據庫學科歸屬判別的研究成果。目前相關論文中針對的研究對象幾乎全部集中于WoS、ESI和Scopus等外文數據庫,很少涉及對人文社科學科評價所必須應用的CNKI和CSSCI等中文數據源的探討。研究成果上的缺失既有可能是實踐中應用數據庫的范圍不完整造成的,也有可能是難以解決CNKI和CSSCI的數據學科歸屬判別難題的真實寫照。無論何種原因,人文社科學科評價中數據的權威性和廣泛性均有賴于對多源異構數據的收集分析,因此必須展開全面的跨庫數據學科歸屬判別的實踐和分析。其次,映射理論與數據庫實踐脫節。圖情領域對分類法映射的研究由來已久,但研究成果卻很少應用于學科評價的數據庫映射實踐中。吳愛芝等在關于北京大學學科評價實踐的論文[11]中雖然提出已經分別建立了各數據庫與評價學科的映射關系,但沒有詳細闡述理論依據??梢?,目前學科映射理論與數據應用實踐呈現出某種程度的脫節。同時,由于缺乏依據學科評價情境形成的一整套解決同類問題的有效策略,從業者往往在面對產生于不同數據庫的數據學科歸屬判別難題時顯得無所適從。因此,為研究人文社科學科評價中跨庫數據的學科歸屬問題,應借鑒已有映射理論,積極探索人文社科學科評價情境中可行的映射方法;拓展人文社科評價的數據庫實踐范圍,對多元異構數據學科歸屬判別的實踐案例進行全面剖析。

2 研究方法、理論基礎與映射思路

2.1 研究方法與數據來源

本研究采用案例研究法。通過南開大學圖書館開展人文社科學科評價服務的實踐案例,剖析其應用多種學科映射方法,對來源于CNKI、CSSCI和WoS數據庫的評價數據進行學科歸屬判別并有效獲取學科數據的過程。數據主要來源于2017年至今南開大學圖書館開展學科評價服務中的學科數據,數據庫源為南開大學IP范圍內可應用的CNKI、CSSCI和WoS數據庫平臺及部分試用數據庫平臺。

2.2 判別學科歸屬的理論基礎

2.2.1 辨析學科分類體系與文獻分類體系

自2002年起,教育部學位與研究生教育發展中心(以下簡稱“學位中心”)依據《學位授予和人才培養學科目錄》[17](以下簡稱《學科目錄》)對全國具有博士或碩士學位授予權的一級學科進行評估,該目錄即成為高校圖書館學科評價服務所依據的學科分類體系。此外,我國的學科分類指導性文件還有《中華人民共和國學科分類與代碼國家標準》(GB/T13745-2009)以及《普通高等學校本科專業目錄》(以下簡稱《專業目錄》)。另外,與學科分類體系相對應的是文獻分類體系。文獻分類通常是指根據文獻內容和形式的異同,按照一定體系有系統地組織和區分文獻[18]。數據庫的學科分類在本質上是一種文獻分類體系,在功能應用及劃分形式上均與學科分類有差異,正是這種差異才不可避免地導致了獲取學科評價數據時的難題。為了更直觀地解讀這兩類分類體系,本研究分別對3種學科分類體系和兩種常用的中外文數據庫的文獻分類體系進行了多維度辨析,具體內容見表1。如表1 內容所示,學科分類體系與文獻分類體系在應用范圍、分類原則構成等方面均有差異。根據分類示例的展示,可知3種學科分類體系的類目表達方式十分接近,而《中國圖書館分類法》(以下簡稱《中圖法》)作為文獻分類體系對于學科內涵的揭示與學科分類體系之間有相通性,由此也為建立映射關系提供了可行性。

表1 主要學科分類體系與文獻分類體系概覽

2.2.2 探究學科映射方法

人工映射和自動映射是兩種常用的映射方式。建立人文社科學科評價的映射關系既需要明晰學科分類體系的應用范圍及分類原理,也需要厘清不同數據庫的文獻分類規則,同時更需要了解評價學科的研究范疇甚至其獨特的發展歷程。從這個意義上講,現階段主要由學科評價從業者和學科信息專家通過人工映射完成定性研究的學科映射方案更符合目前人文社科的評價情境。具體映射過程中采用更為科學和規范的映射方法則可以有效降低主觀性因素的影響。詹萌的研究[10]表明,可以通過對《中圖法》進行類目解析、建立基于字面和語義相關性以及尋找專業或學科知識點相關性等途徑來構建學科分類體系與文獻分類體系之間的映射關系。在借鑒該項研究成果的基礎上,本文案例對這3種方式均有應用,但相對更廣泛地使用了基于語義相關性的映射法和基于知識內涵相關性的映射法。語義映射法是以學科類目名稱作為映射元素,在兩類分類體系之間尋找學科名稱的同一性或語義相關性,由此建立映射關系的方法,根據實際情況也可以細分為字面相關性和語義相關性的具體映射途徑?;谥R內涵相關性的映射是以學科或專業的知識點作為映射元素,通過確定學科在兩類分類體系中所覆蓋的知識點層面的相關性來確定映射關系的方法。

2.2.3 學科映射方案的總體思路

根據相關理論基礎,本研究設計了用以指導南開大學人文社科學科評價中判別學科歸屬的學科映射方案的總體思路(見圖1),主要包括如下步驟:(1)梳理分類體系及了解學科評價情境;(2)對需建立映射關系的學科分類體系與數據庫文獻分類體系進行同質性或異質性辨析;(3)根據辨析過程,規劃同質性或異質性分類體系下的學科映射方案;(4)基于學科映射方案,分別采用以學科類目名稱作為映射元素的語義映射法和以學科內涵知識點作為映射元素的知識內涵映射法完成映射工作;(5)對其他映射方案的可行性探索、驗證與特殊學科的處理。

3 南開大學圖書館學科評價服務中跨庫數據的學科歸屬判別實踐

2017年至今南開大學圖書館根據學科特點和實際需求,先后為政治學、中國史、世界史、理論經濟學和應用經濟學等人文社會科學一級學科提供了學科評價服務[19]。本部分案例展示的是對來自CNKI、CSSCI和WoS等數據源的評價數據實現合理判別學科歸屬的實踐過程。每個數據庫的具體實踐分析都包括兩部分內容:分別是學科分類體系辨析及數據庫學科評價功能揭示,以及在此基礎上設計的特定學科規劃并實施的學科映射方案。

3.1 CNKI數據庫的學科歸屬判別實踐

(1)分類體系辨析:基于《中圖法》學科分類體系。中國知網系列數據庫(CNKI)是評估學科中文科研成果的重要數據來源。CNKI 在“使用手冊”中提到其文獻分類是根據《中圖法》獨創的學科分類體系[20],與確定評價學科所依據的《學科目錄》是兩種本質不同的異質性分類體系。而且,其檢索項中沒有設立“學科”檢索字段,因此無論是其檢索字段的設置還是其獨創的學科分類體系都無法契合學科評價的檢索需求,必須重新規劃學科映射方案。

(2)映射方案1:基于知識內涵相關性的學科映射。通過分析CNKI文獻分類原則及檢索特點,在針對政治學一級學科的學科評價服務中,學科館員規劃了基于知識內涵相關性的映射方案,以實現在該平臺上政治學的學科數據歸屬判別,具體步驟及詳細內容見表2。

表2 基于知識內涵相關性的政治學學科映射具體步驟

根據知識點內涵相關性映射方法,完成上述映射過程主要包括明確學科內涵、梳理兩類分類體系下的學科分類方法、提取學科映射的知識點元素和完成映射4個步驟。需要指出的是,并不是所有知識點都可完成映射匹配。根據學科發展情境的變化,有些知識點的學科歸屬還需要視學科變化進程而定,目前暫時無法完成映射。根據對可產生映射關系的學科內涵知識點的挖掘,完成了對CNKI 社會科學I 輯文獻中政治學學科的具體映射,提煉出“政治學”“中國政治與國際政治”“政黨與群眾組織”3個學科類別中的19個具體研究專題的學科數據。

(3)映射方案2:基于《中國高校教學科研成果大數據分析平臺》的字面相關性學科映射。2017年南開大學圖書館試用《中國高校教學科研成果大數據分析平臺》,該平臺是知網研發的評定高校教學科研成果的定量分析工具。平臺最突出的特點是學科分類是以教育部2011年《學科目錄》與《中圖法》(第五版)為基礎設置。該平臺的文獻分類體系與教育部一級學科目錄完全一致,屬于同質性分類體系,可以采用語義映射法。依據語義相關性選擇字面相同的學科名稱,即可獲取相應的學科數據。為了在多種映射方案中形成相互印證,學科館員分別將在兩種方案中得到的科研產出數據進行對比,其結果數據的差異在可接受的范圍內,因此這兩種方案仍是CNKI數據庫中進行學科歸屬判別的最為可行的方式。

3.2 CSSCI數據庫的學科歸屬判別實踐

(1)分類體系辨析:數據庫學科分類依據的多元化。中文社會科學引文索引(CSSCI)是我國人文社會科學重要的文獻信息查詢與評價工具。關于其分類體系的依據,在其網站上公布的遴選標準[22]中明確指出數據庫學科分類的依據是《中華人民共和國學科分類與代碼國家標準》(GB/T13745-2009),并參照《學位授予和人才培養學科目錄(2011年)》(學位[2011]11號)和《國家社會科學基金學科分類目錄》進行。CSSCI的檢索系統及與學科相關的檢索字段的設置均是數據庫學科分類依據的多元化帶來的結果。這種現狀為學科歸屬的判別實踐帶來兩個難題:首先是如何甄別“學科類別”與“學位分類”這兩個與學科數據檢索與獲取相關的檢索字段;其次是難以應用一種映射方案完成人文社會科學全域范圍內的學科數據的判別??梢?,對于CSSCI數據庫的學科歸屬判別必須融合多種映射方案完成。

(2)映射方案1:基于字面相關性的13個人文社科一級學科的映射。CSSCI高級檢索方式中分別設有“學科類別”與“學位分類”檢索字段,選擇哪個檢索字段作為學科數據的檢索字段與其所依據的分類體系緊密相關。CSSCI在其附表中分別提供了“學科代碼”“學科類別”的具體含義,其中“學科代碼”與《中華人民共和國學科分類與代碼國家標準》(GB/T 13745-2009)中的學科代碼完全一致,從而也說明CSSCI“學科類別”字段所代表的分類體系來源于國家標準中的學科分類體系;而根據檢索實踐的結果,“學位分類”檢索字段的分類體系更多的是依據《學科目錄》。因此,選擇“學位分類”字段進行學科數據獲取是合理且適宜的。通過對檢索字段內涵的甄別,不僅解決了選擇檢索字段的問題,也完成了對CSSCI學科分類體系的辨析及在此基礎上映射方案的規劃。由于“學位分類”字段所依據的分類體系就是教育部的《學科目錄》,這種分類體系上的同質性使我們可以應用字面相關性的映射方法完成學科數據歸屬的判別。根據《學科目錄》以及教育部學位中心開展學科評估中對人文社會科學學科的設定,人文社科類共包括17個具有博士或碩士學位授予權的一級學科。應用以上映射方案,17個人文社科一級學科中的13個一級學科在學科名稱字面上是完全匹配的,可以直接通過“學位分類”字段的檢索來獲取學科數據,完成映射。

(3)映射方案2:基于語義相關性的2個人文社科一級學科的映射。CSSCI“學位分類”字段包括17個一級學科中的13個學科,無法實現人文社科一級學科的全域映射,馬克思主義理論、考古學、中國史和世界史這4個一級學科的學科名稱沒有出現在“學位分類”字段,必須尋找新的映射途徑。

CSSCI“學科類別”字段所依據的分類體系來源于《中華人民共和國學科分類與代碼國家標準》(GB/T13745-2009),這與教育部的《學科目錄》雖然并不完全一致,但它們本質上都屬于同質性學科分類體系,這為應用同質性分類體系下的映射方法奠定了基礎。CSSCI高級檢索“學科類別”字段的學科范圍中設有“馬克思主義”和“考古學”兩個學科,其中“馬克思主義”在字面上與教育部《學科目錄》中的“馬克思主義理論”學科名稱不完全一致,但學科類目名稱的語義層面是一致的。因此,對于無法在“學位分類”中獲取學科產出數據的馬克思主義理論和考古學一級學科,通過語義相關性判別學科歸屬,選擇“學科類別”字段進行數據獲取的檢索方式也不失為一種可行的方案。

(4)映射方案3:基于《中圖法》類目分析的2個人文社科一級學科的映射。世界史于2011年2月正式成為一級學科,與中國史和考古學并列成為歷史學學科門類下的一級學科。這種來自學科發展過程的變化沒有及時在數據庫文獻分類中體現出來,目前CSSCI的“學科類別”和“學位分類”字段都只能檢索到“歷史學”的學科文獻,無法將“中國史”和“世界史”文獻從其中較為清晰地分離出來,因此根據學科映射方案的總體思路,針對這種特殊學科的處理,需要結合數據庫特點探索其他映射方案。

CSSCI設置有“中圖分類號”檢索字段,可以揭示每篇文獻的中圖分類號,有利于應用《中圖法》類目分析的方法來判別學科數據。具體做法是:選擇CSSCI數據庫中的“中圖分類號”檢索字段,收集評價機構在特定評估年份中CSSCI歷史學論文的總體數據及中圖分類號的相關數據,對照《中圖法》,將論文分為“K0 史學理論”“K1世界史”“K2中國史”“K3-7世界各國和地區史”“K82中國人物傳記”5個區間,逐一統計分析。其中“中國史”學科數據包括“K2中國史”,“世界史”學科數據包括“K1世界史”和“K3-7世界各國和地區史”。這種方法基本上可以實現“中國史”和“世界史”學科數據的歸屬判別,但無法做到數據的完全精確,其中數量較少的“史學理論”及“中國人物傳記”部分的學術論文的歸屬還都需要經過與專家協商,從論文的內容中判別學科歸屬。

CSSCI是人文社會科學學科評價的重要數據來源和分析工具,探討它在數據學科歸屬判別實踐中的應用具有重要意義,有必要進行全方位整理。關于分別在CSSCI數據庫中應用“字面相關性”“語義相關性”及“《中圖法》類目解析”3種方案實現對學科數據的判別及有效收集的整體思路總結如圖2所示。

圖2 應用CSSCI數據庫判別人文社科學科數據歸屬的思路及路徑

3.3 WoS數據的學科歸屬判別實踐

(1)分類體系辨析:WoS核心合集學科分類體系的特殊性。Web of Science(WoS)是科睿唯安公司的信息服務平臺,支持自然科學、社會科學、藝術與人文學科的文獻檢索,該平臺的WoS核心合集是世界上最有影響力的多學科學術文獻文摘索引數據庫。作為學科國際科研成果的重要數據源和評價工具,WoS對人文社科學科評價服務的重要意義不言而喻。WoS核心合集包括254個學科類別[23],學科粒度劃分細致,其學科體系的劃分與業界熟悉的3類中文學科分類體系以及《中圖法》文獻分類體系均有本質差異,僅從學科名稱難以實現對評價學科的準確匹配,必須以新思路實現數據的學科歸屬判別。

(2)映射方案1:基于知識內涵相關性的學科映射。根據相關理論及過去幾年的學科評價實踐,南開大學學科服務團隊認為可以基于異質性學科分類體系下的知識內涵相關性的方法來規劃WoS 平臺的學科映射方案,其中的關鍵在于對學科內涵的深入和全面理解。以政治學為例,從學科名稱上看,WoS 核心合集的Web of Science類別字段中有“Political Science”學科,但除了學科名稱字面上的對應之外是否還有其他學科也有對應關系,需要進行學科內涵的理解和挖掘。WoS核心合集中的“Master Journal List”部分就收錄文獻與其學科類別的歸屬進行了說明,詳細描述了254 個學科的文獻收錄范圍,這對我們理解WoS每個學科類別的具體內涵大有裨益。表3 是Categories&Collections(Scope Notes)[24]對Web of Science 類別中的“Political Science” 和“International Relations”學科內涵的描述。根據表3中對這兩個學科內涵的描述,看出它們在研究內容、研究范圍及所覆蓋的知識點上與《學科目錄》中“政治學”學科內涵較為一致,可以成為“政治學”的映射學科。在進行學科映射的過程中,由于無法確定是否將Web of Science類別字段中的“Area Studies”也作為政治學的對應學科,學科館員積極與院系的學科信息專家進行探討,發現“Area Studies”的學科內涵闡述中雖然也包含政治學的部分內容,但其知識點內涵上更傾向于歷史學和跨學科研究。因此,對于映射過程中交叉學科的辨析,在院系學科信息專家的協助下認真完成對學科知識內涵的深度挖掘是十分必要的。

表3 WoS核心合集中Political Science和International Relations的學科內涵描述

(3)映射方案2:應用InCites評估工具的字面相關性的學科映射。InCites是科睿唯安公司基于Web of Science Core Collection 引文數據建立的綜合性科研績效評估工具。自2017年起,南開大學圖書館開始應用InCites進行學科數據獲取工作,這主要得益于該平臺提供了多種學科分類體系的選擇,其中就包括與教育部學科分類體系進行映射后呈現的China SCADC Subject 97 Narrow(教育部110個一級學科中的97個)學科分類體系。由于該分類體系與教育部學科分類體系一致,可直接應用字面相關性的映射方法,選擇“研究方向”字段來獲取學科數據。例如,選擇研究方向=“0202 Applied Economics”,就可以獲得應用經濟學的學科數據。表4是InCites平臺中China SCADC Subject 97 Narrow分類體系與教育部學科評估分類體系中人文社科學科的對應情況。從表4 分析看出,InCites 平臺China SCADC Subject 97 Narrow學科分類體系可以實現與教育部學科分類體系中17個人文社會學科中的15個一級學科的對應,只有“0305馬克思主義理論”和“0501中國語言文學”2個一級學科,目前暫時無法實現學科映射。

表4 教育部學科分類體系中人文社科學科與InCites平臺China SCADC Subject 97 Narrow學科分類的對應

4 案例啟示

4.1 學科評價中跨庫數據學科歸屬問題的本質及根本原因

數據的學科歸屬問題是伴隨著學科評價服務的深入逐漸凸顯的,在從業者的實踐中通常表現為無法通過數據庫獲取評價學科的科研成果數據,或者說它更為直觀地表現為數據庫檢索難題。事實上,這類問題是涉及學科分類體系、文獻分類體系、學科映射方法以及數據庫學科評價功能應用等多維度的科學問題。學科歸屬問題的根本原因是在學科評價服務的特定情境中由學科評價需求聯結的兩類分類體系之間的差異造成的。這兩類分類體系分別是產生學科信息檢索需求所依據的學科分類體系和滿足檢索需求的數據庫文獻分類體系,它們在分類原則等方面的本質差異引發了數據的學科歸屬問題。

4.2 規劃可操作的映射方法是根本途徑

在兩類異構的分類體系之間建立可操作的映射關系是解決數據學科歸屬問題的根本途徑,由此關于映射方法的探究成為本文重要的理論基礎。本項研究提出規劃學科映射總體思路的重要前提是對學科分類體系和數據庫文獻分類體系進行同質性或異質性辨析,這既需要明確學科分類體系的設置原理及類目層級,也需要分析數據庫文獻的分類原則及學科評價功能?;趯Ψ诸愺w系的辨析,本文分別構建了基于語義相關性和基于知識內涵相關性的映射方法,并就每種方法在不同數據庫中的應用進行了具體闡述。

4.3 對CNKI 和CSSCI 數據庫的實踐探索是人文社科學科評價數據源全面性的保障

人文社科學科評價中數據的權威性和廣泛性有賴于對多源數據的全面收集,但目前所見的研究成果中針對的研究對象幾乎全部集中于WoS、ESI和Scopus等外文索引數據庫,很少涉及對中文數據源的探討。本文應用案例研究法,分別探究了如何對來自CNKI、CSSCI 和WoS等數據源的評價數據實現合理判別學科歸屬的實踐過程,尤其是創新性地對CNKI 和CSSCI 數據庫規劃了多種學科映射方案,這種多維的跨庫探索是人文社科學科評價中數據源全面性的重要保障。

4.4 促進多種學科映射方案的相互印證

數據庫文獻分類體系極具復雜性,一個數據庫有時會涉及多種分類體系,同時數據庫的學科服務功能也呈現動態性,新的學科評價功能及檢索方式時有更新,針對這些變化及數據庫的特點,為每個數據庫規劃多種學科映射方案,并盡力在多種映射方案之間完成學科數據的有效驗證十分必要。

4.5 學科映射實踐中的制約性因素

應用多種學科映射方案可以完成特定學科在CNKI、CSSCI 和WoS 數據庫中的學科映射,但仍會面臨一些制約性因素。在基于知識點內涵映射方法的實踐中,對學科知識點的提煉十分重要,這既需要充分了解該學科內涵,更有賴于對學科在不同分類體系中的類目揭示的深入分析。例如CNKI數據庫的實踐中,3種學科分類體系與《中圖法》文獻分類體系在政治學學科類目層級的劃分上呈現高度的一致性,可以較為順暢地完成知識點映射元素的提取,但這是否適用于所有的人文社科一級學科,有待繼續探究。同時,學科評價中一些新情況的出現,例如教育部學科目錄對一二級學科設置的變化等,都會影響映射關系的產生。另外,交叉性強的學科的數據歸屬判別以及數據庫學科評價功能的更新等因素都會在一定程度上制約學科映射實踐的完成。

5 人文社科學科評價中合理判別跨庫數據學科歸屬的策略

鑒于數據學科歸屬問題在人文社科學科評價中的重要意義,有必要從單個數據庫的個性化實踐中提煉出共性的具有指導價值的整體應對策略。根據數據庫映射實踐案例,提出人文社科學科評價中合理判別跨庫數據學科歸屬的主要策略,如圖3所示。解決評價數據的學科歸屬問題需要從理論到實踐,從宏觀到微觀的全面規劃,因此在應對策略中既包括在理論基礎上構建映射思路,也包括執行學科映射方案的具體方法,更值得注意的是其中需要考慮的情境性因素。合理、動態的實踐情境對于人文社科學科評價的學科歸屬判別具有重要意義,這既有賴于從事學科評價服務的館員與院系信息專家的深度合作,也需要館員始終以動態的思維和發展的眼光關注學科發展的進程和數據庫學科評價功能的不斷完善。

圖3 人文社科學科評價中合理判別跨庫數據學科歸屬的策略

6 結語

在“雙一流”建設的大背景下,學科評價中數據的學科歸屬問題不僅直接影響著學科評價數據的精準性,也會對交叉學科及學科分類研究產生間接影響,因此對此類問題的持續關注和探究意味著要繼續從理論上展開對多種學科分類體系和學科映射方案的探討,也意味著要積極推動和鼓勵形成可推廣的實踐對策。同時,本項研究主要應用了人工映射方式下的不同映射方案,這與目前人文社科學科評價情境及學科發展的動態性和復雜性較為契合,但未來是否可以在處理好諸如學科分類體系變化、學科內涵豐富、數據庫評價功能更新等因素的基礎上實現人工映射與自動映射的融合值得進一步探索。

猜你喜歡
學科分類社科人文
社科成果展示
社科成果展示
社科成果展示
人文紹興
高校二級學院科研管理模式研究
審計學成為一級學科可行性研究
中醫藥信息學教育發展歷程回顧與學科發展現狀分析
人文社科
誰來教“醫學人文”課
讓人文光輝照耀未來
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合