?

基于引文內容分析的圖書學術影響研究
——以《小科學，大科學》為例

2021-05-31 00:51雷天驕孫浩東王魯燕

圖書與情報 2021年2期

雷天驕孫浩東王魯燕

（1.西北農林科技大學圖書館陜西咸陽 712100）

（2.中國農業大學圖書館北京 100083）

在跨學科研究飛速發展的今天，學科間的聯系越發緊密。而圖書、論文作為科學知識記錄和傳播的載體也是緊密聯系的，研究者在開展論文創作時經常參考前人的經典著作，為自己研究的開展奠定基礎，提供依據。圖書的引用和被引用是科學研究中的一種普遍現象，體現了知識的繼承和傳播，反映了科學的不斷發展，對圖書學術影響的評價意義重大。

《小科學，大科學》倡導采用科學方法分析科學的發展，關注科學發展對社會各方面的影響，是科學計量學的奠基之作,具有重要地位和研究價值。本文構建了引文內容標引體系，采用引文內容分析法分析《小科學，大科學》的學術影響，以期為圖書的學術影響評價提供借鑒。

1 研究述評

目前，基于引文分析的圖書學術影響評價主要采用傳統引文分析法，如李德竹的《咨詢巨人》一書通過分析施引文獻的語種、文獻類型、年代、學科分布來歸納《as we may think》的影響力分布。相關研究集中在采用圖書在論文中的被引頻次來衡量圖書的學術影響大??；蘇新寧以CSSCI數據庫為統計源,篩選出了各學科中被論文引用最多、學術影響最大的圖書。他提出通過提取引用圖書頻次高的論文，分析這些論文與什么主題相關，從而發現圖書主要在哪些學術領域發揮著學術影響力，為研究者開展學術研究提供指導；丁翼對CSSCI（2000-2007）中法學論文引用圖書的頻次進行了統計，篩選出了法學領域學術影響力最大的圖書；賈潔統計了CSSCI數據庫“圖書館、情報與文獻學”類論文引用圖書的情況，評價了該學科圖書影響力的大小。還有文獻基于SSCI中的引文數據對丁肇中的科研成果影響力進行了評價。一些研究對《小科學，大科學》一書的學術影響進行了簡單分析。胡志剛、侯海燕等對《科學的社會功能》《小科學，大科學》在Web of Science中的被引情況進行了引文分析，探索它們產生影響的學科范圍及其在Scientometrics期刊中產生的影響；Garfield同樣也曾對《小科學，大科學》的被引情況進行過簡單的分析。

一些學者對僅采用引用頻次評價文獻學術影響的方法提出了質疑，嘗試采用引文內容分析法進行更科學、深入的分析。Moravcsik在引文分析時加入了引用行為指標，對物理學領域30篇論文的引文行為進行了分析，解讀了它們被正面引用、負面引用的情況；Frost、Maricic進一步對引文位置和引文功能的關系進行了研究。Garfield對作者的引用行為進行了分類。Zhang等基于引文的語法和語義，提出了引文內容分析框架，以更好地挖掘研究行為的文化背景。章成志等從引用位置、引用強度、引用長度以及引用情感出發，分析了不同學科中文圖書的被引行為。李卓等進一步挖掘了圖書的被引動機及其與引用位置、引用長度的關系。周清清和章成志對圖書影響力評價研究進行了總結和展望，認為運用內容分析法評價圖書影響力可以進一步判斷用戶引用或閱讀圖書的意圖、態度、需求。傳統引文分析法忽視了引文的語義信息，無法觀察引文動機，不能說明被引內容對施引文獻的具體影響力和重要性。因此，僅通過傳統引文分析法來評價圖書的學術影響是不充分的，還需結合引文內容分析來深入挖掘圖書的學術影響。采取引文內容分析方法來分析文獻的學術影響越來越受到關注，并逐漸走向成熟，形成了基本的研究步驟和研究體系。

2 研究方法

引文內容分析的步驟包括：確定分析內容、引文信息抽取、引文類型歸納分析。第一，確定需要分析的引文內容信息，建立分析體系，通常包括引用行為和引用主題兩個方面；第二，標注引文信息，標記引文在全文中的位置，并通過語境、上下文等判斷施引文獻的引用行為，進行記錄；最后，開展引文類型歸納分析，對所標記的各項引文內容信息進行統計分析，揭示被引內容對施引文獻的具體影響。

2.1 數據獲取

本文選取社會科學引文索引（SSCI）作為外文期刊的來源數據庫。運用被引檢索功能，輸入“lit*sci*big sci*”進行檢索，去除無關文獻，共檢索到73個版本，1992條《小科學，大科學》的被引記錄。檢索日期為2018年1月5日。選取中文社會科學引文索引（CSSCI）作為中文文獻的來源數據庫。運用被引文獻檢索功能，選擇“被引篇名（詞）”選項，輸入“小科學，大科學”進行檢索，共檢索到39個版本，64條《小科學，大科學》的被引記錄；輸入“little science，big science”進行檢索，共檢索到82個版本，140條《小科學，大科學》的被引記錄。去除無關文獻，共檢索到197條被引記錄，檢索日期為2018年1月7日。

根據SSCI中引用《小科學，大科學》文獻的年代分布（見圖1），1963-1979年間每年引用《小科學，大科學》的文獻數量波折迅速上升，一是因為文獻剛發表的前幾年一般是引用高峰，新的理論受到大家密切關注；二是因為1963年后，普賴斯在科學學、科學史方面的研究不斷深入，促進相關研究形成熱點、產生更大的影響，這也一定程度上提升了《小科學，大科學》的受關注度和影響力。1979-2008年，每年引用《小科學，大科學》的文獻數量平穩變化，穩定在較高的數值，《小科學，大科學》產生了持續的學術影響。2008-2009年，每年引用《小科學，大科學》的文獻數量急劇增長，之后年份的每年引用數穩定在了更高的數值。2009年引用《小科學，大科學》文獻的研究主題集中在跨學科研究、科學價值的探討、科研合作、開發獲取、文獻計量可視化幾個方面，《小科學，大科學》包含的科學學思想與時代發展下越來越強的科研合作趨勢以及強大的計算機技術相結合，煥發出了新的活力，產生了深遠的學術影響。

CSSCI中每年引用《小科學，大科學》的文獻數量隨時間變化波折變化（見圖2）。文獻數量在2013年達到頂峰，2013年是普賴斯逝世30周年，一批紀念普賴斯逝世30周年的文獻發表，這些文獻歸納總結了普賴斯對科學學和其他學科的貢獻，對中國和世界的影響。此外，2013年文獻的研究主題還集中在計量分析和科研合作。

2.2 構建分析框架

由于從不同角度獲取的引文內容特征不同，引文分析的需求也千差萬別，因此在進行引文分析之前，需要根據實際情況制定引文分類體系，按引文分類體系對引文進行標記和總結。早在1965年，Garfield就提出了15種引文動機。Finney從引文位置和引文內容出發，設計了引文內容分析框架。Oppenheim、Renn設計了一個包含7個類別的分類體系。Chubin以肯定或否定、內涵或補充、基本或附屬將引文內容劃分為6個類別。研究者根據自身研究目的不同提出了不同的引文內容分析框架，但它們的普遍適應性較差。

對主要的引文內容分析框架體系進行整理，可將現有體系歸納總結為4個維度：（1）引文功能，即被引文獻在施引文獻中發揮的作用；（2）引文質量。被引文獻在施引文獻的哪一部分被引用，是核心部分，還是外圍部分等；施引文獻自身的質量；（3）情感傾向。施引文獻對被引文獻的情感傾向，是積極、消極還是中立；（4）引用動機，即被引文獻為什么要引用施引文獻。其中引文功能、引文質量、情感傾向是已有引文分析框架中最重要的三個維度。本文從這三個維度出發構建了引文內容分析框架體系（見表1）。

表1 引文分析框架表

圖1 SSCI中引用《小科學，大科學》文獻的年代分布

圖2 CSSCI中引用《小科學，大科學》文獻的年代分布

引文功能可以反映被引文獻對于施引文獻影響程度的大小，如有機引用的文獻往往比機械引用的文獻對施引文獻的影響更大。情感傾向體現了引用者對于被引文獻肯定或否定的態度。引文質量可以反映哪些內容在引用者的研究中發揮了更重要的作用。引文質量與引文功能的分布表現出了較強相關性，因此本文將這兩個維度的標注結果結合分析，以提升分析結果的客觀性。

本文綜合對于引文內容屬性標引的研究，通過直接引用/間接引用，有機引用/機械引用/都不是指標來反映引文功能，通過引文位置、被引次數指標反映引文質量，通過正面引用/負面引用/中性引用指標反映情感傾向。確定引文內容屬性標引體系后，抽取引文信息，在全文中定位引文位置，對其進行標記，并通過引文上下文及全文中的其他相關信息判斷施引文獻的引用行為，進行記錄。最后，進行引文類型歸納分析，對所標記的各項引文內容信息進行統計，整合統計結果，揭示統計結果所反映的現象，得出結論。

本文分引文所在章節和引文內容信息兩部分對SSCI、CSSCI文獻全文信息進行了人工標注，梳理了標注內容名稱（見表2）。

2.3 數據標注

本文采用抽樣的方法，在SSCI中1992條《小科學，大科學》一書的被引記錄中抽取了116篇文獻的全文，對其引文內容進行人工標注（標注樣例見圖3）。

將SSCI中引用《小科學，大科學》的文獻數據導入Citespace軟件中，選擇時間段為1963-2018年，年份分割為1，數據類型為“Noun Phrases”，節點類型為“keyword”，生成關鍵詞共現網絡后進行聚類，并添加聚類標簽，得到SSCI關鍵詞聚類視圖（見圖4）。

表2 引文內容屬性標引體系信息表

圖3 SSCI引文標注結果樣例

由圖所示，SSCI數據庫中引用《小科學，大科學》的文獻主要聚類在以下知識子群中：情報學（information science）、科學依據（scientific basis）、盲目變化（blind variation）、計量經濟學理論（cliometric metatheory）、生物醫學文獻（biomedical publication）、科學演化的表現（scientific evaluating performance）、機構合作（institutional collaboration）、電子學學術交流（electronic scholarly communication）、復雜創新體系（complex innovation system）、出版物模式（publication pattern）。本文所抽取的116篇文獻涵蓋了這十個知識子群的內容，具有一定的代表性。

本文提取了CSSCI中《小科學，大科學》可以取得全文的被引記錄，共獲得全文193個，對其引文內容進行人工標注（標注樣例見圖5）。

圖4 SSCI關鍵詞聚類圖

圖5 CSSCI引文標注結果樣例

對這309篇文獻的標注內容進行統計，在統計時對字段名稱進行清洗，如將introduction和background統一歸入前言、背景部分，將分析討論的章節統一歸入分析部分等，將全部章節歸為前言背景、方法和數據、分析、結論和展望四個部分。

為保障標注質量，由兩位標注人員分別對這309篇全文進行了獨立標注，標注者通過章節名、引文的位置、上下文內容等信息判斷將引文歸于文章的那個部分，通過引文內容和上下文內容等信息判斷引文功能，依據引文內容屬性標引體系信息表進行標注。本文采用Kappa系數對人工標注結果的一致性進行了檢驗，得出檢驗結果（見表3）。

本文運用SPSS分別計算SSCI、CSSCI引文位置標注結果和SSCI、CSSCI引文引用功能標注結果的kappa值，分別得到SSCI和CSSCI引文位置分布結果（見表4、表5）、引文被引頻次分布結果（見表6、表7）、引文引用功能分布結果（見表8、表9）和引文情感傾向分布結果（見表10、表11）。根據一致性參考指標（K≥0.8為十分可靠，K≥0.69為較為可靠），一致性檢驗結果均大于0.8，說明標注結果十分可靠。

表3 一致性檢驗結果

表4 SSCI引文位置分布表

表5 CSSCI引文位置分布表

表6 SSCI引文被引頻次分布表

3《小科學，大科學》引文內容分析結果

3.1 引文位置分布分析

在SSCI中，《小科學，大科學》在文獻的前言、背景部分被引頻次最多，反映出《小科學，大科學》的內容主要作為文獻的研究背景、理論基礎出現，為后人的研究起鋪墊作用。其次是文獻的分析部分，主要作為開展計量分析的依據出現，推動了計量方法在科學研究中的應用。最后是文獻的結論部分和方法與數據部分。

在CSSCI中，《小科學，大科學》在文獻的分析部分被引頻次最多，為文獻的分析部分提供了理論依據，其次是文獻的前言、背景部分，最后是文獻的結論部分和方法與數據部分。

3.2 引文被引頻次分布分析

表7 CSSCI引文被引頻次分布表

表8 SSCI引文引用功能分布表

表9 CSSCI引文引用功能分布表

表10 SSCI引文情感傾向分布表

表11 CSSCI引文情感傾向分布表

在SSCI中，《小科學，大科學》在每篇文獻中的被引頻次多為1次或2次。一篇分析歐洲國家高產學者跨國研究的文獻中，《小科學，大科學》被引用了5次?！缎】茖W，大科學》中提出的知識生產系統大規模、跨國不平等的設想對該文獻的研究思路產生了較大影響。被引頻次為2次及以上的文獻多為人才評價相關文獻，大多引用了《小科學，大科學》中的“看不見的學院”?！翱床灰姷膶W院”闡釋了非正式的科學交流形式對科學發展的意義，可以延伸出人才成長軌跡對于文獻計量的補充價值，因此在人才評價相關文獻中被多次引用?！缎】茖W，大科學》不僅推動了文獻計量方法在科學研究中的運用，也對采取非文獻計量手段進行科學評價提供了思想指引。

在CSSCI中，《小科學，大科學》在每篇文獻中的被引頻次多為1次，多作為文獻的研究基礎、理論依據出現，《小科學，大科學》的思想作為研究的中心線貫穿全文的文獻很少。

3.3 引文功能和引文質量深度分析

在SSCI中，文獻前言、背景部分直接引用《小科學，大科學》的思想主要包括科研合作、知識爆炸、科學評價、探索科學發展規律四個方面，《小科學，大科學》在這些領域提出的觀點極具前瞻性?！缎】茖W，大科學》是科學學、科學計量學的奠基之作，它的觀點直擊科學學、科學計量學的研究核心，因此在文獻的前言、背景部分被多次引用，至今為科學學、科學計量學及相關研究提供理論指引。

少數文獻在方法和數據部分直接引用了《小科學，大科學》，為研究采用的方法進行補充說明?！缎】茖W，大科學》一書承認文獻計量方法存在不足，但表示其在包含不足的同時依然可以反映出一些現象和規律，肯定了文獻計量方法存在的意義。

文獻分析部分直接引用《小科學，大科學》主要有兩種情況，一是使用普賴斯定律等文獻計量規律開展分析，二是驗證普賴斯在《小科學，大科學》一書中提出的假說?！缎】茖W，大科學》提出的理論、規律至今仍引發討論，其所產生影響的時間和范圍十分長遠。

文獻結論和展望部分直接引用《小科學，大科學》的思想主要包括：多作者論文數量穩定增長；文獻數量的對數很多時候比文獻本身更具意義；科學家的科研產出活動存在冪律分布；研究能力的分布是相當傾斜的，主要是對分析結果進行解釋和說明。

對《小科學，大科學》的間接引用主要出現在前言、背景部分，大多是表明前人在相關領域已經有一定研究成果的機械引用。一些文獻使用了普賴斯提出的概念，如知識產業。一些文獻強調了《小科學，大科學》及普賴斯思想的重要意義，如稱普賴斯是第一個發掘作者間合作網絡意義的人。

SSCI中，《小科學，大科學》被引用最多的內容是科研合作?！缎】茖W，大科學》提出通過多作者文章衡量合作，對通過文獻計量衡量科研合作做出了開創性貢獻。同時，有機引用占的比例更大。對于一本在1963年就已首次出版的著作，《小科學，大科學》不僅作為過往的研究積累被引述，其中的一些思想和方法經久不衰，持續發揮著對科學研究的引領和推動作用。

在CSSCI中，文獻前言、背景部分直接引用《小科學，大科學》的內容主要為科研合作相關內容和書中提出的概念?！缎】茖W，大科學》為師生合作、非正式合作等多種科研合作研究奠定了基礎。同時它所提出的一些新的概念和理論，如“小科學”和“大科學”的概念，為一些研究問題的提出提供了出發點，也為相關理論研究提供了依據。

文獻方法和數據部分直接引用《小科學，大科學》的思想主要包括：核心作者的判定；小規模的非正式科學交流群體比較穩定，當非正式交流群體中人數破百時，會因溝通不暢解體成小規模群體。核心作者的判定作為文獻計量學的基本方法，在文獻計量分析中被廣泛運用。非正式科學交流群體的規模限制則為群體產出論文數等結論的科學性提供了一個驗證方法。

文獻分析部分直接引用《小科學，大科學》的文獻大多與我國的科研現狀、科技政策緊密聯系，如關于我國西部科研發展的思考，產學研合作創新研究，民間科技創新發展探討等。一些文獻引用了《小科學，大科學》中關于科研經費分配的內容，一些文獻分析了“無形的學院”產生的社群影響?！缎】茖W，大科學》對科技政策制定和科研經費分配提供了借鑒，具有實踐性。

文獻結論和展望部分直接引用《小科學，大科學》一書的思想主要包括：論文一般在發表后1-2年內被引次數最多；技術方面的優秀研究者通常在科研合作中也表現突出。對于論文在發表后1-2年內被引次數最多的觀點，多篇論文對其進行了進一步探討，地區分布、學科種類、科研團隊、學科所處發展階段、學科熱點等因素都可能導致論文被引高峰的不同，論文被引高峰的觀點被熱烈討論，對引文分析法的發展產生了積極影響。

對《小科學，大科學》的間接引用主要包括：肯定這本書的開創性意義，如稱其提出了現代文獻計量學方法，首先提出一些計量學的指標，率先研究科研合作；作為普賴斯生平貢獻的一部分被展示；展現《小科學，大科學》與其他科學社會學著作的高共被引次數，體現《小科學，大科學》在科學社會學領域的高影響力。這些間接引用大多為機械引用，主要分布在文獻的前言、背景部分。

CSSCI中，《小科學，大科學》的引文以探討理論為主，與文獻計量相關的文獻多為基礎的文獻計量分析，鮮有深入分析的文獻。同時，機械引用占的比例更大，多為對《小科學，大科學》里程碑意義的肯定和對其經典思想的提及。

3.4 引文情感傾向分布分析

SSCI中樣本文獻對《小科學，大科學》的引用均為正面引用，一是因為《小科學，大科學》中的很多理論和思想已被奉為經典，對之后的研究具有很強的正面借鑒意義；二是因為對于《小科學，大科學》中表述不完善、不嚴謹的內容，在文獻中多以補充、延伸的方式對其發展完善，而非否定其內容。

而在CSSCI中，《小科學，大科學》被負面引用1次，其余均為正面引用。這1篇負面引用的文獻對《小科學，大科學》提出的科研合作理論提出了質疑?！缎】茖W，大科學》提出，科研合作將不斷加深，合作研究數量會不斷增加并接近無限大。而之后的研究者對這一觀點進行了修正，認為沒有一種持續的力量能使得論文作者數越來越多，因此論文的合作數也會達到一種穩定狀態，不同學科的穩定狀態不同。

3.5 中外文文獻引文內容分析結果比較

3.5.1 中外文文獻分析結果的共同特征

中外文文獻對于《小科學，大科學》的引用均為直接引用多于間接引用，有機引用和機械引用相近，極少有負面引用。這說明《小科學，大科學》作為科學計量學的奠基之作，不僅作為研究的理論基礎、思想借鑒被引用，其中的一些思想仍然是研究的核心內容，產生了深遠的影響。

中外文文獻對于《小科學，大科學》的間接引用均以機械引用為主，主要分布在文獻的前言、背景部分，作為研究成果回顧、綜述的一部分，一定程度上反映了間接引用行為和機械引用行為的強相關性。中外文文獻對于《小科學，大科學》的直接引用均以有機引用為主，但直接引用中也存在一定數量的機械引用，直接引用行為與有機引用行為存在相關性，但其相關性弱于間接引用行為和機械引用行為的相關性。

3.5.2 中外文文獻分析結果的差異

外文文獻中《小科學、大科學》在前言、背景部分被引頻次最多，為科學學、科學計量學及相關研究提供理論指引。中文文獻中《小科學，大科學》在分析部分被引頻次最多，大多與我國的科研現狀、科技政策緊密聯系。中文相關文獻的實踐性更強。

《小科學，大科學》在外文文獻中的被引頻次以1次和2次為主，在中文文獻中以1次為主。與中文文獻相比，外文文獻引用《小科學，大科學》的內容更為豐富，在科研合作、知識爆炸、科學評價、探索科學發展規律、文獻計量方法等方面都展開了深入地研究，中文文獻的研究主要集中在科技政策研究和簡單的文獻計量分析，鮮有深入研究。外文文獻對于《小科學，大科學》的每年引用數在2009年后穩定在較高的數值，而中文文獻的每年引用數在2013年后有所下降，研究熱度降低。我國學者應更加重視對《小科學，大科學》思想的挖掘，與知識爆炸、科學評價等熱點研究相結合，促進我國科學學、科學計量學和相關學科的發展。

4 結語

本文從引文功能、引文質量、情感傾向三個維度出發構建了引文內容分析框架，選取SSCI、CSSCI數據庫中引用《小科學，大科學》的施引文獻為研究對象，對《小科學，大科學》具體影響了哪些主題的研究、在文獻中主要發揮了怎樣的作用進行了深入挖掘，并對比分析了中外文文獻引文內容分析結果，從而更全面、客觀地展示出了其學術影響。因此，在對圖書的學術影響進行評價時，應注重引文內容分析法的應用，根據需求構建合理的分析體系，本文構建的引文內容屬性標引體系可作為參考。

本文還存在著一定的局限性，首先，引文分析方法作為一種評價方法，可以反映評價對象受到的同行的認可和重視，但也要重視同行評議在學術評價中的地位。此外，采用人工標注效率較低，統計數量有限，未來可采用機器對文獻全文內容信息進行抽取，對海量數據進行引文內容分析。

圖書與情報2021年2期

圖書與情報的其它文章: 社會認識層次論視域下的圖書情報學：結構與邏輯*; 用戶受教育水平的提升與公益性信息服務的轉型*
——基于社會認識層次論的實證研究; 公益性信息服務績效評價的“拐點”識別研究*
——基于社會認識層次論的探索; 高校知識創新的信息資源基礎研究*
——以社會認識層次論為視角; 突發性公共衛生事件中居民的風險信息感知研究*
——基于全國81個城市的調研數據; 突發事件社會風險放大的信息作用機制研究*

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合