?

三角引用關系中文獻位置的差異對比研究

2024-02-28 11:37楊文霞鄧三鴻胡昊天閆曉慧
信息資源管理學報 2024年1期
關鍵詞:年份跨學科雙向

楊文霞 鄧三鴻 胡昊天 孔 嘉 閆曉慧

(南京大學信息管理學院,南京,210023)

1 引言

16世紀后期,論文引用制度形成,參考文獻成為學術論文的特征[1]。隨著國際參考文獻格式的逐漸規范,引文分析領域逐漸發展,由此引申出幾種常見引用關系,即直接引用關系、耦合關系[2]、共被引關系[3]等。其中,共被引關系是指文獻A、B被文獻C同時引用,耦合關系是指文獻B、C同時引用文獻A,直接引用關系是指文獻A、B、C之間存在直接引用。Liu等[4]綜合了三種引用關系,提出了三角引用的概念,指的是文獻A和文獻B被文獻C引用,同時文獻A也被文獻B引用的引用關系(見圖1)。他們以文獻A為源頭,得到文獻B、C的三角引用,本文稱之為正向三角引用;但若同一篇文章在三角引用中分別以文獻B和文獻C為源頭時,分別得到文獻A、C和文獻A、B的三角引用(見圖2),本文稱之為“雙向三角引用”和“逆向三角引用”,對于這兩種三角引用是否存在,若存在,那么三種三角引用數據集的范圍是否會有不同,以及三種數據集的數據特征、引用特征是否相同等問題,Liu等則未做研究。

圖1 三角引用圖示[4]

圖2 三角引用結構及其詳解

為了補足三角引用的研究,本文首先對相關研究進行了綜述,并通過對比之前的研究討論本文的貢獻。其次,討論三種三角引用關系在實際引用網絡中是否存在、存在概率;分析三種三角引用的數據特征和引用特征。最后,對以上研究進行總結與討論,并給出未來研究展望。對三角引用關系進行分析,有助于在更廣泛意義上統一引文網絡的基礎單元和結構。

2 相關研究

2.1 文獻三角引用研究

三角引用指的是A和B被C引用,同時A也被B引用的關系[4]。A、B、C分別被命名為“原始文獻”“中介文獻”和“追隨文獻”。其中引用-被引關系包括直接引用關系、耦合關系和共被引關系。結合社會網絡分析來看,三角引用屬于社會網絡中三方組譜系的——三方傳遞關系[5],映射到引用網絡中,可以理解為三方傳遞引用關系。

Liu等[6]認為,C通過B引用A具有間接引用的特點,并對正向三角引用中的C間接引用A的動機進行了分析。首先,通過B→A和C→A的引文內容相似度,識別出引文相似度較高的C,分析C間接引用A的語境和動機;其次,基于內容標注分析三角引用關系中功能性和情感性的引用動機[7];最后,基于全文本內容分析對三角引用關系中的引用強度、引用位置、引用順序和引用情感等進行分析[8]??梢钥闯?Liu雖提出了正向三角引用,并基于此進行了后續研究,但并未涉及本文所提出的雙向三角引用和逆向三角引用,為了拓展三角引用的研究,本文將對這三種三角引用進行分析。

2.2 文獻間引用關系的研究

文獻間引用關系主要包括直接引用關系、耦合關系和共被引關系三種。不少學者采用多種引用關系結合的方式,對文獻進行了比較和實證對比研究。例如,Boyack等[9]以生物醫學領域為例,比較了直接引用、共被引、耦合和引文上下文混合方法的聚類準確性,結果表明,耦合的效果優于共被引,同時混合方法也進一步優化了文獻耦合的結果,而直接引用最不準確。然而,該文獻并未將三種引用關系結合分析,而若將三者結合將會發掘出更多的價值[10]。Wang、王菲菲等[11-12]以基因編輯領域為例,從作者角度將共被引、耦合和直接引用這三種引用關系結合得到加權直接引用網絡指標,結果發現了更多在領域知識交流與傳播中的重要貢獻者。而Liu等[4]則從引用網絡的角度分析三種引用關系,并將三者結合形成三角引用結構。相比于加權引用指標,三角引用結構更加清晰、簡潔,更能從微觀角度深入理解引用結構。

2.3 引用特征的研究

一些學者從學科、文獻類型、國家、期刊影響因子等方面,分析了引用外部特征。例如,Bornmann等[13]以化學領域為例發現,小領域發表的論文數量較少,相比一般領域,得到的引用機會也較少,論文被引次數更少;Moed等[14]通過研究各學科中論文下載量和被引頻次之間的相關性發現,兩者相關性在不同學科、期刊、文獻類型中存在差異;Pichap-pan等[15]從作者自引的特點和影響等方面綜合論述了作者自引的優勢與存在的缺點。此外,不同的國家由于科學背景和財政支持不同,發表的論文質量也有高低,例如,美國機構發表的論文通常比其他國家的機構發表的論文得到更多的引用[16];最后,在高影響因子的期刊上發表論文會比在低影響因子的期刊上獲得更多的引用[17]。

此外,一些學者還從多個角度分析了文獻影響的特征。Gomes等[18]從期刊影響因子、合著者數量和機構地址的數量三個方面得出期刊影響因子越高、合著者數量越多、機構地址數量越多,文章的引用次數越多的研究結論。Tahamtan等[19]通過系統地回顧相關文獻指出,影響被引頻次的因素包括論文、作者、期刊三個方面的論文質量、參考文獻、影響因子、出版形式、作者性別等28個因素,如龔凱樂等[20]從語言、文獻類型、期刊、學科等角度對中國期刊論文中的跨語言引用進行多維分析發現,中國學者有五種獨特的引文國際化模式。

以上研究雖然包含多種文獻的外部引用特征,但是未涉及三角引用,因此在上述研究的基礎上,本文將從數據特征、引用時間、跨語言、跨學科、文獻類型以及自我引用等方面研究三角引用文獻的外部引用特征和內部發展趨勢。此外,三角結構的網絡基礎片段,是整個引文網絡中的基本單元,傳統的研究或從引文的角度進行分析,或從結構的宏觀特征角度進行分析,本文則從中觀層面對三角引用進行了更為細致的分析,這對于系統理解引文關系以及引文網絡具有重要的價值和意義。

綜上所述,三角引用關系是社會網絡分析映射到引用網絡中的特殊引用結構,為了驗證雙向三角引用和逆向三角引用的存在,并分析其特征,本文提出以下問題:

1.三種三角引用是否存在?若存在,三種三角引用的特點、引用結構是怎樣的?

2.三種三角引用數據集的數據特征、引用時間、跨語言引用、跨學科引用、文獻類型、自我引用等是否不同?

3 三角引用相關概念

3.1 三角引用的相關概念

(1)不同文獻類型定義

原始文獻是同時被中介文獻和追隨文獻引用的文獻,中介文獻在引用原始文獻的同時又被追隨文獻引用,追隨文獻則同時引用原始文獻和中介文獻。為了便于理解,本文在不同類型的三角引用中使用相同的文獻種類名稱,原始文獻、中介文獻和追隨文獻統一表示為A、B和C。A、B、C兩兩之間存在的引用關系,則被稱為三角引用關系。

(2)三角引用關系定義及三種三角引用

正向三角引用是以原始文獻為核心文獻,基于引證文獻的向前檢索得到中介文獻和追隨文獻。雙向三角引用是以中介文獻為核心文獻,基于引證文獻和參考文獻的向前向后相結合得到原始文獻和追隨文獻。逆向三角引用是以追隨文獻為核心文獻,基于參考文獻的向后檢索得到原始文獻和中介文獻。

(3)三種三角引用結構

三種三角引用不同的內在引用結構詳見圖2。虛線表示未真實發生三角引用,實線表示發生了引用,粗線表示發生了真實的三角引用,帶底色的A、B、C表示以該類文獻為核心文獻。

3.2 三種三角引用對比

在正向三角引用中,集合Di表示原始文獻的引證文獻。由于中介文獻和追隨文獻同時引用了原始文獻,因此中介文獻和追隨文獻都需要從原始文獻的引證文獻集合Di中析出,所以,原始文獻的引證文獻集合D中引用了其他Di的文獻即為追隨文獻C(D2、D3、D4),被其他Di引用的文獻即為中介文獻B(D1、D2)??梢钥闯?中介文獻和追隨文獻以集合形式出現,且兩者存在重復文獻。A與集合Bi和集合Ci就組成了三角引用關系。

在雙向三角引用中,集合Ai表示中介文獻的參考文獻,集合Ci表示中介文獻的引證文獻。根據中介文獻的參考文獻和引證文獻是否發生引用關系,得到原始文獻和追隨文獻,所以Ci中引用了Ai的文獻即為追隨文獻C(C2、C4),Ai中被Ci所引用的文獻即為原始文獻A(A2、A3、A4)。原始文獻和追隨文獻以集合形式出現,且兩者并不存在重復文獻。集合Ai、B與集合Ci就組成了三角引用關系。

在逆向三角引用中,集合Di表示追隨文獻的參考文獻。原始文獻和中介文獻同時被追隨文獻所引用,因此兩者都需要從追隨文獻的參考文獻Di中得到,所以追隨文獻的參考文獻集合D中引用了其他Di的文獻即為中介文獻C(D2、D3、D4),被其他Di引用的文獻即為原始文獻B(D1、D2)??梢钥闯?原始文獻和中介文獻以集合形式出現,且兩者存在重復文獻。集合Ai、集合Bi與C就組成了三角引用關系。為了區分三種三角引用,本文對三種三角引用關系的核心文獻、引用過程、引用狀態和引用方向做了對比,見表1。

表1 不同三角引用對比

4 數據與研究方法

4.1 數據的選擇與搜集

4.2 研究設計

本文首先獲取三種三角引用關系數量以及對應的各類文獻的數量;其次,分析三種三角引用關系以及對應的各類文獻的存在概率;最后,對比分析三種三角引用的數據特征和引用特征,研究流程詳情見圖3。

圖3 研究流程圖

4.2.1 存在概率

確定和比較三種三角引用關系在實際引用網絡中的存在與覆蓋范圍,有助于確保本研究的可行性和價值。因此,對三角引用關系存在概率和三種三角引用中各類文獻存在概率進行了定義,見表2。

表2 三種三角引用中各類文獻及引用關系存在概率公式

由圖2中三種引用結構可知,三角引用關系是從三種文獻之間的直接引用關系、耦合關系和共被引關系中析出的。其中正向三角引用的中介文獻和追隨文獻都是從原始文獻的引證文獻中得到,雙向三角引用的原始文獻和追隨文獻分別是從中介文獻的參考文獻和引證文獻得到,逆向三角引用的原始文獻和中介文獻都是從追隨文獻的參考文獻得到,由此得到三種三角引用中各類文獻存在的概率公式。

4.2.2 引用特征分析

(1)引用時間分析

時間在整個科學的發展和進化過程中扮演著重要的角色。通過搜集三種三角引用關系對應文獻的出版年份,將發表時間間隔分別計算為年(A←B)、年(B←C)和年(A←C),分析比較三種三角引用關系在引用時間方面的特征。年(A←B)表示中介文獻B引用原始文獻A的時間間隔,年(A←C)表示追隨文獻C引用原始文獻A的時間間隔,年(B←C)表示追隨文獻C引用中介文獻B的時間間隔。

隨著我國經濟的發展,人們的生活水平逐漸提高,人們在滿足物質需求的同時,對生命質量加強了重視,為了有效的提高護理質量,現階段我國醫院提倡對患者進行預見性護理,本實驗中,對研究組婦產科手術患者實行預見性護理,實驗結果顯示,觀察組患者護理滿意度為94.29%,高于對照組的82.54%,而并發癥發生率卻遠低于對照組,這就表明預見性護理效果良好,可以有效的改善患者的心理狀態,提高護理有效率,減少并發癥的發生[12-15]。

(2)跨語言分析

跨語言引用對于很多學者來說存在閱讀和理解障礙[21]。通過搜集三種三角引用關系中文獻的語言,了解是否存在跨語言的引用情境,并分析三種三角引用中出現跨語言引用的概率。由于核心文獻為英語,因此,根據是否為英語分為五種跨語言引用??缯Z言分類見表3。

表3 三種三角引用分類情況

(3)跨學科分析

跨學科引用與參考體現了不同學科間知識的輸入與輸出,能夠促進知識的發展與創新[22]。對三種三角引用關系中文獻所屬研究領域進行分類,了解是否有跨學科傾向,及三種三角引用中出現了跨學科引用的概率。由于核心文獻為LIS學科,因此,根據文獻所屬學科是否為LIS學科,對跨學科引用進行分類,具體見表3。

(4)文獻類型分析

科學文獻是知識的載體,主要包括期刊論文、學位論文、會議論文、報紙、圖書、專利、標準等,不同的科學文獻類型在科學交流中起到的作用不同,從文獻類型的角度,分析和比較三種三角引用關系中的文獻類型,找到各自側重的文獻類型,探討不同文獻類型對引用行為偏好的影響。文獻類型分類見表3。

(5)作者自我引用分析

一般認為,如果一篇文獻中的某一位或多位作者也存在于另一篇文獻的作者中,那么這兩篇文獻之間就存在作者自我引用。本文定義了5種作者自我引用的類型,見表3。

5 結果與數據分析

從20篇高被引論文的正向三角引用、雙向三角引用和逆向三角引用的統計數據中發現,三種三角引用包含的文獻總數分別為4765篇、6012篇和876篇,并分別形成了9125條、17438條和1550條三角引用關系。表4—表6和表7分別為三種三角引用的不同文獻和引用關系及其出現概率的統計數據和描述性統計。

表4 正向三角引用的統計數據(部分)

表5 雙向三角引用的統計數據(部分)

表6 逆向三角引用的統計數據(部分)

表7 三角引用關系中不同文獻和引用關系及其出現概率的描述性統計

5.1 三種三角引用數據特征與出現概率分析

從表4—表6可以看出,在正向三角引用中,中介文獻數量與追隨文獻數量相差較大;在雙向三角引用中,原始文獻數量和追隨文獻數量相差非常大;相比于前兩者,逆向三角引用的原始文獻數量和中介文獻數量相差較小。表7中三種三角引用中不同文獻類型數量之間的平均值之差和出現概率之差也可以側面證明以上結果。由于正向三角引用是基于引證文獻的前向引用,隨著時間的推移,中介文獻數量與追隨文獻數量保持動態增加,且由于C←(A、B)形成動態的共被引關系,隨著時間的拉長,C集合中新的Ci不斷出現。因此相對于中介文獻,追隨文獻的數量在后期會保持增加,圖4可以佐證。逆向三角引用是基于參考文獻的后向引用,參考文獻是靜態的,不會隨著時間的逆向發展而一直處于增加的狀態,因此出現了原始文獻數量和中介文獻數量相差不大的情況。而雙向三角引用是同時基于引證文獻和參考文獻的前后向結合的三角引用,引證文獻為動態,參考文獻為靜態,中介文獻一旦出版就意味著原始文獻的數量被固定下來,而追隨文獻的數量可以一直保持增長,因此,追隨文獻的數量和原始文獻的數量相差懸殊。從所有文獻的總和來看,雙向三角引用最多,正向三角引用次之,逆向三角引用最少。這正是由于三種三角引用的引用方向不同導致。

圖4 正向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖

從表4—表7可以看出,三種三角引用都有相關文獻和三角引用關系存在,這表明,在實際引用網絡中,不但存在正向三角引用[4],也同樣存在雙向三角引用和逆向三角引用。雖然三種三角引用存在數量有較大差別,但是出現概率存在相似之處。從出現概率的平均值來看,雙向三角引用>正向三角引用=逆向三角引用,中值也可以側面證實。因此,在三角引用關系中較容易存在雙向三角引用。三種三角引用數據集存在明顯不同的特征,在正向三角引用中,追隨文獻出現概率的均值要大于中介文獻,表明追隨文獻較中介文獻更易存在;在雙向三角引用中,追隨文獻出現的概率大于原始文獻,表明追隨文獻較原始文獻更易存在;在逆向三角引用中,中介文獻出現的概率要遠遠大于原始文獻,表明中介文獻較原始文獻更易存在。從時間尺度上看,除核心文獻外,三種三角引用中越靠前的文獻就越容易存在。

5.2 引用特征分析

5.2.1 引用時間分析

分別對三種三角引用中不同類別文獻發表的年份間隔進行計算。圖4—圖6分別代表正向三角引用、雙向三角引用和逆向三角引用各自的文獻類別年份間隔分布,其中橫軸代表時間間隔,縱軸代表文獻數量,不同的顏色代表不同的引用關系。

在圖4中,年份間隔出現負值是由于目前存在優先發表制度。年(A←B)和年(B←C)呈典型的正態分布且兩者差距較小,年(A←C)與前兩者走勢差距較大,在0-9年呈增長趨勢,9-10年略微下降。在0-6的年份間隔中,年(A←B)和年(B←C)的數量要高于年(A←C),且分別有86.48%、84.58%的文獻數量分布在該年份間隔;而在6—10的年份間隔中,年(A←C)的數量則要高于前兩者,且有77.19%的文獻數量分布在較大的年份間隔。在較小的年份間隔區間,年(A←B)和年(B←C)的數量增加較快,且分別在4年和3年的間隔年達到峰值,而(A←C)的數量增加則較慢;隨著時間間隔變大,前兩者都在下降,而年(A←C)則是繼續增加且增加速度較快,然后在8年的年份間隔達到峰值后下降。因此,年(A←B)和年(B←C)在年份較小的間隔內分布較多,年(A←C)在年份較大的間隔內分布較多。

從圖5中可以看出,年(A←C)呈正態分布,年(A←B)也大致呈正態分布,其年份間隔較長則是基于參考文獻的角度向后引用。而年(B←C)則一直增長到8的年份間隔然后下降,其年份間隔較短是基于施引文獻的角度向前引用,由于來源文獻為2011年,因此截至2021年,最長時間為11年。就現有數據來看,年(B←C)雖然在8的年份間隔達到最大值,但有一直增長的可能性,而年(A←B)在6的年份間隔達到最大值,卻沒有增長潛力,意味著追隨文獻C對中介文獻B的引用可持續性更強,這說明向前引用要比向后引用具有更強的發展性。雖然雙向三角引用的三種引用關系與正向三角引用并不完全相同,但仍然是年(A←B)和年(B←C)先達到峰值并在年份較小的間隔內分布較多,年(A←C)后達到峰值,且在年份較大的間隔內分布較多。年(A←B)在年份間隔較大時分布并不連續,且在年份較大的間隔時有跳躍性增加,如30年和38年的年份間隔。

圖5 雙向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖

在圖6中,三種三角引用的年份間隔基本呈正態分布,且年(A←B)和年(B←C)年份間隔的發展趨勢基本一致,但是前8年的間隔都是年(B←C)要高于年(A←B),8—13年的間隔出現反復,之后則年(A←B)高于年(B←C)。與前兩種三角引用相比,相似的是,年(A←B)和年(B←C)先達到峰值,年(A←C)后達到峰值;年(B←C)和年(A←B)在年份較小的間隔內分布較多,年(A←C)在年份較大的間隔內分布較多;不同的是,在年份間隔較大時,三種引用關系分布都不連續,尤其是年(B←C)。前兩種三角引用的年(A←C)分布走勢都較為和緩平滑,而逆向三角引用的年(A←C)則顯示出明顯的跳躍式走勢。

圖6 逆向三角引用的年(A←B)、年(A←C)和年(B←C)分布圖

總體來看,三種三角引用的文獻類別年份間隔分布完全不同,正向三角引用的年份間隔較短,為[-2,10];雙向三角引用和逆向三角引用的年份間隔則較長,分別為[0,66]和[0,56]。從數據量角度來看,雙向三角引用的引用關系數量最多,其次是正向三角引用,逆向三角引用的引用關系數量最少。綜合來看,無論在哪種三角引用中,年份間隔較短時年(A←B)和年(B←C)的文獻數量較多,年(A←C)的文獻數量較少,隨著年份間隔的拉長,年(A←B)和年(B←C)的文獻數量變少,年(A←C)的文獻數量則在增加。這意味著年份間隔較短時,年(A←B)和年(B←C)的直接引用關系反應較快,年(A←C)的間接引用關系反應較慢;隨著年份間隔拉長,要經過兩個直接引用關系才能實現追隨文獻引用原始文獻,因此,在文獻數量上體現為年(A←C)較為滯后。知識需要經過A←B的內化和B←C的外顯,才能實現A←C的知識外化。因為一篇論文被引用需要經過同行評議、出版、閱讀、分析理解、引用等過程。經過時間的洗禮,有價值的文獻被逐漸篩選出來,得到更多追隨文獻的引用,這也是((A、B)←C)共被引關系的動態性的表現。該原因較為容易理解,正向三角引用對其他兩種三角引用的原理分別是雙向和逆向的知識擴散,正是由于正向知識擴散的存在,才使得雙向和逆向知識擴散和溯源成為可能。

5.2.2 跨語言分析

分別對三種三角引用關系中A、B、C所屬語言進行分類統計,見表8。在本研究中,主要語言是英語。

表8 三種三角引用的語言差異

從語言類型來看,全英語引用的類型占絕對優勢,尤其是在逆向三角引用中,說明在A、B、C都是英語的情況下,更易出現三角引用;在耦合英語引用中,正向三角引用和雙向三角引用較多,而逆向三角引用不存在該類型;連續英語引用和共被引英語引用則分別少量出現在正向三角引用和雙向三角引用中;無相同語言引用則完全沒有出現在任何類型的三角引用中,意味著三種文獻語言都不同的三角引用幾乎不可能出現。

通過閱讀耦合英語引用類型中的文獻發現,在正向三角引用和雙向三角引用中,C引用B的內容和B引用A的內容存在較高的相似度。意味著在引用過程中,當A和B同時為英語,而C為其他語言時,文獻C的作者是通過B來引用A的。原因是文獻C的作者可能受到語言閱讀和理解障礙,因此更傾向于參考或復制B的參考文獻,從而間接引用A。而逆向三角引用中沒有出現該類型,是由于逆向三角引用是以C為核心文獻,向后追溯相關研究內容,由于受到語言障礙,更傾向于引用同種語言。

此外,本文還統計了正向和逆向三角引用中涉及的其他九種語言,其中西班牙語最多,在49條三角引用關系中出現,最少的是匈牙利語,只有1條,說明和其他語言相比,西班牙語的追隨文獻更傾向于引用原始文獻A和中介文獻B。以上結果意味著語言差異也是影響三角引用出現的重要因素。

5.2.3 跨學科分析

分別對三種三角引用關系中A、B、C所屬學科進行分類統計,見表9。

表9 三種三角引用的跨學科引用分布

在表9中,正向、雙向和逆向三角引用關系中跨學科引用分別為7131條、17571條和1792條,分別占三種三角引用關系的78.15%、78.39%和74.32%,其余則為同學科引用??梢钥闯?相比于同學科引用,跨學科引用在引用關系中占大部分,且更傾向于出現在雙向三角引用中,其次是正向三角引用,最后是逆向三角引用。耦合跨學科引用更傾向于出現在正向和雙向三角引用中,在逆向三角引用中共被引跨學科引用最多;連續跨學科引用在雙向和逆向三角引用中的數量都是最少的,正向三角引用中共被引跨學科引用則最少;全部跨學科引用在三種三角引用中都出現較多。

此外,本文還統計了正向三角引用、雙向三角引用和逆向三角引用中所涉及的學科,研究發現,三種三角引用的LIS跨學科引用分別包括113種、112種和38種學科,涉及數量較多的跨學科包括computer science、business &economics、engineering、psychology、medical informatics、health care sciences &services等。這一結果與Huang等[23]和Chang等[24]的LIS跨學科研究結果基本一致。

5.2.4 文獻類型分析

分別對三種三角引用關系中A、B、C的文獻類型進行了分類統計,計算不同文獻組合的數量和占比。表10顯示了三種三角引用關系中各類文獻類型組合中的排名前10的組合,圖7為三種三角引用中文獻類型組合的概括對比。

表10 三種三角引用中各類文獻類型組合分布

圖7 三種三角引用中文獻類型組合的概括對比

綜合來看,在三種三角引用中,A、B、C的文獻類型主要是article、review,其次是editorial material、proceedings paper,其他文獻類型包括letter、software review、book review、note、news item和discussion。一方面,article、review、editorial material和proceedings paper在三種三角引用中占有絕對優勢,其組成的A-B-C文獻類型組合在三種三角引用中都在99%以上;另一方面,article、review、editorial material和proceedings paper類文獻在人文社科領域承擔著記錄和傳播主要研究成果的重任,在知識交流中扮演著重要角色,因此在引用網絡中也具有絕對的數量優勢。

在三種三角引用的A-B-C文獻類型組合中,數量最多的是article-article-article,分別占49.61%、41.08%和43.09%,其次分別是review-article-article、article-review-article、article-article-review,各自占比17.14%、21.71%和24.58%。在圖7中,A-B-C文獻類型組合最多的仍然是相同文獻類型,如article-article-article和review-review-review,最少的則是A-B-C屬于三種不同的文獻類型??梢钥闯?無論是哪種三角引用,A-B-C文獻類型相同的組合數量都是最多的,A-B-C文獻類型都不同的組合數量都是最少的,這意味著,三角引用更傾向于在前者中出現,更少在后者中出現。但是三種三角引用也存在不同之處,對于正向三角引用來說,共被引文獻類型相同的組合較多,如review-article-article,review-proceedings paper-proceedings paper等;對于雙向三角引用來說,連續文獻類型相同的組合較多,如article-review-article,review-article-review等;對于逆向三角引用來說,耦合文獻類型相同的組合則較多,review-review-article,editorial material-editorial material-article等。

5.2.5 自我引用分析

分別對三種三角引用關系中A、B、C之間自我引用進行分類統計,分析結果見圖8和圖9—圖11。在圖8中,橫坐標為文獻的序號,縱坐標為作者自引在引用關系中的百分比;在圖9—圖11中,橫坐標為文獻的序號,縱坐標為不同種類的作者自引數量。

圖8 三種三角引用的作者自我引用占比

圖9 正向三角引用的自我引用分布

圖10 雙向三角引用的自我引用分布

圖11 逆向三角引用的自我引用分布

從圖8可以看出,三種折線的走勢具有一致性,意味著同一文獻在不同三角引用中的作者自引占比情況具有相似性,其中在三種三角引用中占比都較低的文獻為6—8號、12號和15號,而16號文獻則占比都比較高。其余文獻雖然在三種三角引用中占比有高有低,但基本相差不大,而10號文獻比較特殊,在正向和雙向三角引用中占比都較低,但在逆向三角引用中卻占比最高,且是所有占比最高的。經查證發現,10號文獻的逆向三角引用關系只有1條,且為共被引作者自引,因此出現了這種極端占比。

在圖9—圖11中,正向、雙向和逆向三角引用關系中作者自引分別為2591條、3887條和382條,分別占三種三角引用關系的28.39%、22.29%和24.64%??梢钥闯?相比于無作者自引,包含作者自引的引用關系占比較少,表示大部分文獻都是非自引,自引在三角引用中出現得較少,意味著有很多其他領域作者從事相關領域的研究。雖然作者自引占比較少,但是三種三角引用也存在區別,最常出現作者自引的是正向三角引用,其次是逆向三角引用,最后是雙向三角引用。

從圖9—圖11的縱坐標可以看出,雙向三角引用中作者自引出現的次數最多,其次是正向三角引用,逆向三角引用則最少,這和上文的作者自引總量具有一致性。正向三角引用和雙向三角引用中數量最多的類型是耦合作者自引,而逆向三角引用中數量最多的則是共被引作者自引,連續作者自引在三角引用中的數量都是最少的,尤其在雙向三角引用中最少。根據作者自引類型的定義可知,耦合作者自引和共被引作者自引在引用關系中屬于直接引用,而連續作者自引屬于間接引用,因此,在正向三角引用中,向前引用時作者自引較多;在雙向和逆向三角引用中,向后引用時作者自引較多;而在三種三角引用中,連續作者自引都較少出現。這表示三角引用中作者的自我引用更傾向于直接引用,如B直接引用A、C直接引用B,而間接引用較少,如C引用A。這意味著文獻A和B之間、B和C之間大多是相似的、系統的或連續的研究,他們傾向于同時引用之前完整和相關的研究成果;而文獻A和C之間出現的作者自引較少,意味著文獻A和C之間產生自引較為困難,可能是由于文獻A和C之間的研究內容出現了變化,或者對之前的研究進行了創新或改進。

此外,全作者引用在三種三角引用的作者自引中出現的概率分別為14.70%、8.41%和13.35%,圖9—圖11的全作者引用類型與該數據一致,可以看出,全作者引用在正向和逆向三角引用中出現較多,而在雙向三角引用中出現非常少。當然,在三種三角引用中也存在一些全作者引用數量都較高的文獻,如序號為11的文獻,意味著這些文獻的A、B、C之間形成了系統性的研究,其傳承性和完整性較強。除了以上相同的文獻序號,三種三角引用之間也相互交叉一些文獻序號,如正向三角引用和雙向三角引用的文獻3和9,正向三角引用和逆向三角引用中的文獻2,雙向三角引用和逆向三角引用中文獻16和20。三種三角引用中的全作者引用數量較高的文獻序號既有相同又存在不同,表明三種三角引用既存在一些相似性又保持著各自的獨特性。

6 結論與討論

本文從同一篇文章在三角引用中不同位置的角度提出了正向三角引用、雙向三角引用和逆向三角引用,并對三種引用的特點和引用結構進行了分析。本文從高被引論文的角度出發,獲得了三種引用的數據集,發現三種三角引用關系都存在于實際引用網絡中,且雙向三角引用中最易出現三角引用關系。從文獻數量來看,雙向三角引用最多,正向三角引用次之,逆向三角引用最少。

從引用特征來看,在引用時間上,三種三角引用中年份間隔較短時,年(A←B)和年(B←C)的數量較多,年(A←C)的數量較少,隨著時間間隔的拉長,則相反;其次,在跨語言引用上,同種語言更易出現三角引用,跨語言引用較少產生,這是由于跨語言引用時存在語言障礙;在跨學科引用上,跨學科引用在三種三角引用中占大部分,且更傾向于出現在雙向三角引用中,其次是正向三角引用,最后是逆向三角引用;對于文獻類型,三種三角引用的A、B、C文獻類型主要是article、review,A-B-C文獻類型組合中,數量最多的是相同文獻類型,數量最少的是不同文獻類型;作者自引在三種三角引用中出現的都較少,且都更傾向于出現在耦合作者自引和共被引作者自引中,較少出現在連續作者自引和全作者引用中。

三種三角引用既有相同之處,也存在不同之處。在文獻類型和作者自引中,三種三角引用表現一致;在出現概率、文獻數量特征,以及引用時間、跨語言引用和跨學科引用上存在區別。不同的引用方向、引用結構都會導致三種三角引用存在差別。

在實際應用方面,三角引用結構結合文本相似度與耦合引用強度分析漏引、非相關引用的不合理引用行為,有助于科學合理地評價文章的影響力。以雙向三角引用為例,以文獻B為核心文獻得到文獻A、C,對文獻A、C兩兩配對得到三角引用關系的數據,并刪除發生過三角引用關系的數據,之后計算文章的相似度和耦合引用強度,其中耦合引用強度是指文獻A和C共同引用的文章數量。若相似度高且耦合引用強度也高,表明文獻存在漏引情況。以雙向三角引用為例,對三角引用關系中文獻A、C的相似度和耦合引用強度進行計算,若相似度低且耦合引用強度也低,表明存在非相關引用。以上兩種不合理引用都可結合三角引用結構,從文章內容和共同參考文獻數量兩方面共同分析,從而合理進行科學計量評價。

綜上所述,本研究對三角引用進行分類,證明了三種三角引用實際存在于引用網絡中,并對三種三角引用數據集的數據特征和引用特征進行了分析。但是也存在不足,如作為一項探索性研究,數據僅限于LIS學科的高被引論文,數據量有限,不一定適應于其他學科或引用量較少的論文;數據樣本基本為英文,不能挖掘論文的語言特征是否對三角引用有影響;在時間間隔變化過程中各個引用關系的數據表現、引用特征、網絡特征、知識流動特征的變化都有待研究。因此,為了解決以上問題,有必要對更大規模的數據進行實證研究。

7 未來研究

三角引用是文獻計量學中一種特殊的引用關系和實際存在的現象,具有較高的研究價值和意義。為了從更深層次了解三角引用的引用機制和知識流動特征,今后將以多個學科的文獻數據為研究對象,并從三類潛在三角引用的角度對三種三角引用進行進一步分析和深入研究,即,從文本相似度和耦合引用強度兩方面確定漏引和非相關引用是否存在;從語言差異、文獻類型、學科差異、期刊影響力、發表時間差異、文獻影響力、作者影響力等方面研究三角引用中漏引與非相關引用的影響因素;從引用強度、引用位置、引用動機、引用情感、作者自引等方面分析非相關引用的特點,從而規避漏引與非相關引用的不合理引用行為。

猜你喜歡
年份跨學科雙向
雙向度的成長與自我實現
跨學科教學在高中生物課堂教學中的應用實踐
初中歷史跨學科主題學習活動的實踐與思考
特殊的一年
應用型高校推進跨學科人才培養的路徑探索
商標跨類保護的跨學科解釋
什么是閏年?
一樣的年份
一種軟開關的交錯并聯Buck/Boost雙向DC/DC變換器
一種工作頻率可變的雙向DC-DC變換器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合