?

核物理類論文的“睡美人”現象研究

2019-10-14 03:41文利情
圖書館研究與工作 2019年10期
關鍵詞:睡美人公主現象

文利情

(廣東省立中山圖書館 廣東廣州 510110)

1 引言

在西方的格林童話中,美麗的公主因為受到女巫的詛咒,接觸紡錘時陷入昏睡;百年之后一位勇敢的王子披荊斬棘找到了沉睡的公主,并用真愛之吻破除詛咒喚醒了公主。2004年,荷蘭的定量科學家Raan[1]借用睡美人童話故事,把發表后很少引用、但若干年后被引卻迅速上升的特殊引文現象命名為“睡美人”(sleeping beauty)。明確發表后很少被引用的論文等到其某日被某篇論文引用后才會被大量引用,并提出了相關的幾個定量標準——“沉睡”期年均被引≤2,“蘇醒”后四年內總被引>20,即“睡美人”三大指標:沉睡時長S(length of the sleep)、沉睡深度CS(depth of sleep)、喚醒強度CW(awake intensity)。

“睡美人”是科學計量學中對發表后歷經多年低被引而后轉為高被引的那些學術論文的童話浪漫的描述稱呼,也就是遲滯認可現象。雖然遲滯現象早在20 世紀70 年代就被認識和研究,Raan也不是第一位相關領域的研究者,但他第一次形象而有趣的命名,為遲滯承認領域的研究注入了新的動力,激發了各國學者進行相關研究的興趣,而Glānzel和Garfield[2]把“王子”設定為“公主”沉睡后第一次引用、被引次數相對較高、與“公主”共同被引達到一定次數的論文。依此標準,他們發現有些“公主”先后被多位“王子”親吻,也發現存在一位“王子”同時親吻多位“公主”的現象;李江和葉鷹合作發現高品質論文中存在“公主”“紡錘”“王子”同時出現的“全要素睡美人”(allelements-sleeping-beauty)。這些相關研究發現,“睡美人”論文往往是具有原創性發現當時卻未被認識、而沉寂若干年后終被學界肯定的重要文獻。

2 現階段的“睡美人”現象研究情況綜述

“睡美人”現象在科學研究中是發生概率非常小的事件。有兩個數據可以部分說明這個情況:Glānzel考察了SCI數據庫1980年收錄的45萬篇論文的被引用情況,發現每1萬篇論文中,只有大約1.3篇論文能滿足他所定義的遲滯承認的標準[3]。Raan發現1988年SCI數據庫所收錄的大約100萬篇論文中,只有41篇論文符合他提出的“睡美人”的標準。但是像Romans“睡美人”這樣比較極端的例子,只有一個。具體到上述那篇非常標準的“睡美人”案例,其發生的大背景——兩次超弦理論革命在弦理論發展史上是唯一的,在科學研究中也是非常罕見的現象。

除了上述學術上發生的特殊性,“睡美人”沉睡的另一個重要原因是,該文發布的是一項早熟的科學發現。實際上,表面顯示出來的時間錯位,其內里本質很有可能是其做出的早熟科學發現與當時的科學理論和科學范式不一致,因此,不被同時代科學家理解和認可,有時還會受到抵制,這正如愛因斯坦提出相對論,同時期能理解其意義的不過寥寥數人,而如今,引力波的發現,完善了相對論的整個論據,勢必在科學界引發巨大影響,而此時距離愛因斯坦相對論的提出,已然一個多世紀過去了。這就是Garfield所總結的,早熟發現和阻滯發現都是遲滯承認的子集[4]。查閱相關文獻尚未發現Romans“睡美人”被超弦理論同行批評或抵制的蛛絲馬跡。因此,“睡美人”論文沉睡的原因主要是所發布的科學發現走在了時代前面,同時代科學家看不到其重要意義。

通過對上述現象的思考,另外一個層面上對于沉睡原因的解釋有:是科學新秀,而不是權威發表了超前于時代的論文,再經過一段時間的科學發展,科學權威進行了相似研究并發現了新秀之前的研究論文,這樣就喚醒了“睡美人”。

“睡美人”現象也有相當深刻的學術意義,科學中的遲滯承認現象應該值得科學社會學家關注和研究。情報學家從文獻收藏角度提醒我們,由于“睡美人”現象的存在,在文獻收藏上不能短視,否則,等“睡美人”文獻蘇醒之時,相關信息儲存不當,會導致需要時無法找到此類文獻的出處以及數據,對于科學研究帶來較大的損失[5]。再考察關于“睡美人”現象的學科差異,在李江、姜明利、李玥婷[6]的《引文曲線的分析框架研究——以諾貝爾獎得主的引文曲線為例》一文研究中表明:在自然科學界中“睡美人”的比例分別為8.0%、6.7%、4.0%,而社會科學家中“睡美人”的比例僅為1.4%?!八廊恕鼻€中公主有一段沉睡期,沉睡期內極少被引用,這被認為是“過早的科學發現”,未能得到認可。一旦被喚醒之后,狀態突變,被引次數短時間內激增,這種現象在自然科學家中較常見,國外相關專家的研究也證實了這一觀點。社會科學家的引文曲線相對平滑,“睡美人”現象較罕見。

另一方面,2010年武漢大學的馬費成、望俊成等人[7]則從信息生命周期的角度對“睡美人”被喚醒的原因作了一些探討。他們認為,人們在同一信息的不同生命周期階段對其有著不同的需求,可以從這一角度來研究造成阻滯發現的原因。

對“睡美人”現象的承認存在到逐步發現并不斷尋找其意義的過程中,各國學者都作出非常大的努力,使用了大量數據采樣和數據分析。正是由于“睡美人”的稀缺而又規律不明以及不可預測,使得此方面的研究一直都沒有停止過,還在不斷深入中。

3 “睡美人”現象的分析方法

“睡美人”現象是一種小概率事件,尋找“睡美人”論文需要借助大型數據庫和引文分析工具。

3.1 確認采樣數據

考慮到現階段“睡美人”現象的研究成果,決定考察物理學類論文的“睡美人”現象。由于物理包含很多下屬學科:應用物理、核物理、地球物理等,按照時間和質量的要求,選擇其中一個子分科作深入研究。

首先,從方便獲取數據的角度,筆者考察了CNKI中國引文數據庫CCD、CSCD中國科學引文數據庫,期刊選擇北京大學圖書館“中文核心期刊”中21種物理類刊物。在考察過程中,遇到了以下一些問題:筆者在比對了《物理學報》以及《發光學報》后發現,數據誤差較大,發文數被引數無法統一。CSCD出現了由于作者標明不清,文章計算重復的情況:例如統計《物理學報》2000年發布的論文,共計有452篇,查詢2000—2015年的被引情況時總文章數達到800多篇。CCD也出現了數據不穩定的情況。最后為了保證數據獲取的準確性及其數據意義,選擇了SCI(科學引文索引)作為數據來源。

查找SCI數據,尋找物理的下級科目,考慮到論文價值,簡單直接的方式是選擇影響因子較高的學科門類,根據觀察排比,選擇PHYSICS、NUCLEAR,即核物理相關類目的期刊。此類目錄下含21種期刊,確定采樣數量,考慮工作強度的可控性,選取影響因子前11位的期刊(即影響因子>2的11本刊物)進行取樣調查(如表1所示)。

表1 取樣期刊總引用量及期刊影響因子列表

3.2 采樣數據的處理方式

第一步,設定取值范圍,利用SCI數據庫獲取以上11種期刊2000—2010年的論文被引數據;第二步,從2000年開始直至2010年,通過SCI獲取這部分期刊所發表論文在其發表后第S年的CS,直到2015年末的沉睡深度。網站獲取數據分批量作出CS曲線;第三步,通過大量曲線分析查找、數值設定查找等各種數據處理工具進行數據篩選,選取在S>5的情況下CS曲線前期平滑<20后期突變增大的點、CS-1<20而CS>20時的點記錄,并記錄此數據點CW,即喚醒強度。通過大量取樣分析,觀察不同的曲線情況,對于核物理類目下11本期刊2000—2010年發表的論文進行“睡美人”現象判定。

4 數據分析

4.1 數據曲線

圖1為Annual Review of Nuclear and Particle Science的部分引文數據樣本曲線形狀。橫坐標為年份,縱坐標為被引次數(也就是沉睡深度)。Var***表示論文題目,為方便閱讀,此圖做變量處理簡化命名方式。

圖1 Annual Review of Nuclear and Particle Science 的部分引文曲線圖

考察“睡美人”現象時,曲線種類主要有3種(如圖2-圖4所示)。

圖2 M型的引文曲線圖

圖3 倒V型的引文曲線圖

圖4 下降型的引文曲線圖

4.2 數據結果分析

通過對11本期刊將近5萬篇論文進行曲線分析,其中有引文數據的將近4.3萬篇。由于本次數據處理設置的喚醒強度>20,在數據處理中,MAX[CS]<20的數據最早刪除;S<5的情況下,CS>20的數據也一并刪除,剩下數據約為1萬條左右。按照上述篩選之后,需要處理的數據減少了80%,對于剩下的數據曲線進一步分析,未發現符合“睡美人”現象條件的相關論文。筆者自行設計了符合此次查找要求的“睡美人”曲線以供參考,如圖5所示。

圖5 符合此次查找要求的“睡美人”曲線

5 結語

在科學發現中,論文的遲滯承認現象即“睡美人”現象并不多見,對此方面的研究有利于我們進一步探討該現象對科學發現的影響。經過一番數據收集與分析,此次計量研究,并未發現符合“睡美人”現象的論文,但是發現兩點有趣的現象。首先,按照之前研究者相關論文得出科研的數據,1萬篇論文應存在1.3篇符合“睡美人”現象的論文,將近5萬篇的取樣,理應存在6~7篇符合三要素的“睡美人”;其次,按照諾貝爾獎得主的比例計算8%的數據結果,理應存在更多的“睡美人”。然而,此次采樣結果分析之后并沒有發現“睡美人”現象存在。經過筆者反復思考回顧,有以下幾點可能存在的問題:①采樣期刊量較少。雖然此次采樣選取總量也達到47000多篇論文,但由于睡美人現象本身就是罕見的科學現象,總量不足對于其發現肯定有較大的影響。②采樣時間設置較短。2010年發表的論文的相關引文數據,S最大值即為6,S>5的情況下,CS>20的可考察范圍就僅限一個取值范疇,以此類推,2005年往后的論文,其引文數據考察時S都不可能>10,嚴重限制了可考察到的情況。擁有較多引文數據的論文僅限于2000—2004年發表的相關論文,此區間較為狹窄。③喚醒強度設置過高。本文按照Raan的設置值,將喚醒強度設置為>20,有可能此數值設定得較高,考察時,論文總被引量>20的論文數量都銳減到了2萬篇左右,影響到了“睡美人”現象的發現。補充說明一點,自然科學類“睡美人”現象發生概率遠大于社會科學類,其喚醒強度設置不適宜過低。但由于絕大多數科學家討論時設置的喚醒強度都較高,也應該是考慮到了“睡美人”應為真正的“美人”,太易于喚醒的論文,達不到其“美人”的研究價值。

對于“睡美人”現象的判定,將喚醒強度設定過高對其定義和發現會造成比較大的影響,相反若是設置過低,則其結果并不存在太大意義。根據大量數據觀察,筆者認為更為有效的參考值理應在12以上。筆者將繼續對相關數據進行優化處理,進一步選取更為合適核物理類學科的沉睡深度、喚醒強度,以便于相關學科科研人員可以從中獲得有益結論幫助其進行科學研究。

猜你喜歡
睡美人公主現象
水中睡美人
《遼史·公主表》補述
《愛哭公主》
粉紅兔公主鏡
它們離“現象級”有多遠
小公主
你能解釋下面的現象嗎
猜謎語
奇異現象傳真
《睡美人怕什么》等
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合