?

知識網絡視角下科學、技術、產業間創新驅動關系識別方法研究

2024-02-04 09:43許海云齊硯翠武華維
情報學報 2024年1期
關鍵詞:繼承性網絡結構驅動

王 超,許海云,齊硯翠,武華維

(1. 山東理工大學管理學院,淄博 255000;2. 山東師范大學圖書館,濟南 250014;3. 西北師范大學檔案館,蘭州 730070)

0 引 言

當前國際環境發生巨大變化,產業發展的技術來源、技術路線均面臨重大變革,傳統產業轉型升級遭遇技術障礙,科學理論和前沿技術短缺成為突出矛盾??茖W、技術與產業間的協同發展為科學理論的突破、技術的變革創新、新興及未來產業的發展提供了重要突破口。在此背景下,亟待弄清科學、技術、產業間的創新雙向互促關系的特點,即三者間的創新驅動關系如何。開展科學、技術、產業之間創新驅動關系研究對于實現科學發現、技術創新與產業的深度有效融合和發展具有重要意義?,F有研究更多強調的是科學、技術、產業三者之間一種線性或非線性的相關關系,鮮有研究涉及科學、技術、產業之間的驅動關系,尚未有效刻畫科學、技術、產業間創新驅動關系的特征及規律。本文嘗試從知識網絡視角展開科學、技術、產業間創新驅動關系識別研究。具體來說,通過構建時效知識網絡,以社區網絡結構熵來表征知識網絡結構特征,利用網絡結構間的耦合關系與結構特征信息的傳遞熵探究創新過程中科學、技術、產業三個系統的相互驅動關系,最后利用互信息來探測主要驅動關系下知識傳遞路徑的變化特點,以期通過探索科學、技術、產業之間相互推動、相互反饋的特點,拓展現有科技與產業創新理論,深入揭示科學、技術、產業創新要素的流動和擴散規律,促進知識在科學-技術-產業間的有序流動。

1 相關研究

1.1 科學、技術、產業的概念與關系

科學是客觀規律及知識的發現結果[1],主要解決客觀世界中“是什么”“為什么”的理論問題。技術是改造客觀世界的各種手段、方式、方法的總和,主要解決客觀世界中“做什么”“怎么做”的實踐問題[2]??茖W和技術是構成科技的辯證統一體,兩者的發展體系與路徑不同,但兩者有機融合、相互促進,共同決定了科技的質量、效益和走向[3]。產業在微觀經濟和宏觀經濟的層面具有不同的含義,前者是指一組特定的生成性或盈利性的企業,后者是指能夠生成一組密切相關的原料、商品或服務的經濟部門[4]。國內普遍認可的產業概念是介于微觀和宏觀經濟層面之間的集合概念,是以生成經營服務單位為基礎,能夠提供緊密相關產品或服務的社會經濟行業[5]。

關于科學、技術、產業三者間的關系,主要有線性關系和非線性關系兩類認識。其中,線性關系觀點認為三者之間存在線性轉化關系,現有學者常選用創新鏈模型來描述科學、技術、產業之間線性轉化過程[6-7],即科學產生的理論知識會轉化為實際應用,實際應用中出現的各種新的手段及方法會推動技術創新,技術創新能夠促進產業的迭代與升級。從知識流動的角度來看,這種線性關系反映了知識從科學到產業活動中單向、逐次漸進的知識流動過程,但是在一定程度上對知識從產業到科學技術的反饋機制以及知識活動的系統性關注不足,不利于反映科學技術與產業的真實互動場景。

非線性關系觀點認為三者之間存在非線性的互動關系,即科學技術與產業的互動過程由諸多主體、要素參與,相互作用關系并不是簡單線性的關系。起初,有學者聚焦于科學與技術之間存在的非線性互補[8-9],即科學與技術的二元關聯互動關系。之后,有研究將這種非線性互補的對象延伸到產業層面,即科學與產業[10]、技術與產業[11]的二元互聯互動關系,強調三者之間既有“正向作用”,也有“反向作用”[12]。近年來,有學者嘗試將科學技術與產業看作一個有機運行的整體[13],即科學-技術-產業間三元互聯互動關系。較為典型的是螺旋互動模式,該視角關注科技與產業在時間軸上的交互、融合及其反饋,以螺旋狀的創新演化形式表述三者的關聯互動模式[14]。這種非線性關系可以反映出科學、技術、產業之間存在著相互融合、驅動的復雜互動關系。在這種非線性互動關系基礎上,本文進一步開展具有方向性、可測度的驅動關系研究。

1.2 科學、技術與產業的關系測度研究

科學、技術、產業的內涵及三者之間的關系辨析為定量化揭示三者之間的聯系奠定了理論基礎,有學者嘗試對三者之間的關系進行定量化測度。例如,彭帥等[13]利用專利引文關系來建立關聯測度模型,但是研究依賴于單一的專利數據源,無法更全面地反映三者之間的關聯關系。針對單一數據源無法全面反映三者之間關系的局限性,Kenta 等[15]利用科學論文、專利數據和產業經濟普查數據,圍繞專利引用關系以及聯合申請專利關系等信息,構建了測度三者之間關系的指標。武華維等[16]采用類似于Kenta 等[15]研究的三種數據源,以科學、技術、產業三者的知識元素作為研究對象,利用知識元素的耦合來測度三者的互聯關系。部分學者嘗試利用科學、技術、產業的分類標準之間的映射關系來測度三者之間的關系,如Han[17]、Park 等[18]利用科技論文分類標準和專利分類標準,將科學、技術與產業聯系起來,以此構建知識流動的模型來測度三者間的關系。Wong 等[19]利用構建科技論文、專利分類標準、產業三種分類標準之間的映射關系,在此基礎上實現對科學、技術、產業間關系的測度。

科學、技術、產業之間存在著復雜的互動關系,而且隨著時間的推移而發生變化。但是,現有研究通常側重于某個時期內科學、技術、產業之間的關系,分析時間靜態視角下三個對象彼此之間的關系特點。另外,現有方法更多強調的是三者之間一種線性或非線性的相關關系,鮮有研究涉及不同階段下科學、技術、產業之間具有互動方向性的驅動關系。鑒于此,本文嘗試在知識網絡的視角下,利用網絡結構間的耦合關系與結構特征信息的傳遞熵來探究創新過程中科學、技術、產業三個系統的前后相互驅動關系,以期拓展現有科技創新與產業創新理論。

2 研究方法

知識網絡視角下的科學、技術、產業間創新驅動關系的識別方法,旨在發現三者之間相互驅動關系的模式與特征,主要思路是利用三者之間知識網絡結構的耦合關系與結構特征信息的傳遞熵來探究相互驅動關系。本文的識別方法可以分為3 個模塊7 個步驟,如圖1 所示。

圖1 知識網絡視角下科學、技術、產業間創新驅動關系識別研究框架

模塊1:數據獲取及處理。從多來源數據庫中獲取科學文本、技術文本和產品文本數據,利用自然語言處理技術對獲得的文本數據進行結構化處理,獲取具有實體概念意義的主題詞(步驟1)。

模塊2:知識網絡構建及網絡社區劃分。根據主題詞之間的共現關系構建知識網絡,并利用主題詞的時間屬性構建時效知識網絡(步驟2);利用網絡社區發現算法對時效知識網絡中各時間片上的快照網絡進行網絡社區劃分(步驟3)。

模塊3:基于網絡結構熵的驅動關系識別。計算時效知識網絡的網絡社區結構熵,用于刻畫科學、技術、產業知識網絡結構的變化趨勢(步驟4);利用貪婪高斯分割算法對三類知識網絡結構的變化趨勢進行分段,以定量方式把握知識網絡結構變化的各個階段特點(步驟5);依據網絡結構變化趨勢的定量分段,分別計算各時間段科學、技術、產業知識網絡間的傳遞熵,以此判斷各時間階段三者之間的創新驅動關系,并識別時間段內最顯著的驅動關系(步驟6);計算具有顯著驅動關系的兩類知識網絡時間前后各個網絡社區間的互信息,判斷知識主題(網絡社區)間的繼承性;識別最大互信息,發現具有顯著繼承關系的知識主題;獲取具有顯著繼承關系的知識主題間的知識交集,得到具有顯著繼承性的知識內容;計算相鄰時間段繼承性知識內容間的相似性,探析科學、技術、產業間驅動關系下主要知識傳遞路徑(步驟7)。

具體的步驟及方法詳述如下。

2.1 獲取及處理數據

本文方法的數據是可以表征科學、技術、產品知識內容的文本描述信息,具有廣泛性??萍嘉谋局饕獊碓从谄诳撐?、會議論文、基金項目等形式的科學研究成果,技術文本主要來源于專利文獻、技術標準、技術手冊等形式的技術研究成果,產品文本主要來源于產品說明、產品注冊、產品研發等形式的產業活動成果。

同時,考慮到摘要是對信息主要內容的高度概括,將摘要數據作為構建知識網絡的具體數據對象,以此為基礎,展開科學(S)、技術(T)、產業(I)間的互動關系識別研究。摘要數據通常是非結構形式存在的文本數據,需要利用自然語言處理技術進行相應的分詞、詞性標注、同義詞/近義詞合并等結構化處理,提取具有實體概念意義的主題詞。

2.2 構建時效知識網絡

采用網絡形式表示一個系統(對象)的優勢在于網絡結構可以較好地描述系統的動力機制,可以評估不同網絡之間的相互影響程度[20]。因此,本文在知識網絡的形式下探析科學、技術、產業間創新驅動關系。具體而言,利用知識網絡結構間的耦合關系探究創新過程中科學、技術、產業三個系統間前后驅動關系,更多體現的是三個系統間具有方向性的動態互動關系。

相較于靜態知識網絡,具有時間屬性的時效知識網絡可以更好地反映知識網絡間動態關系的變化以及知識擴散活動的動力機制[21],因此,可以將創新驅動關系的識別研究立足于時效知識網絡中。時效知識網絡是由一段時間內時間片上對象O的靜態知識網絡(快照網絡)組成的,其中,O={S,T,I},S、T、I 分別為科學、技術、產業;t時刻靜態知識網絡記為和Et分別為t時刻網絡的頂點及邊。

2.3 劃分知識網絡社區

知識網絡社區體現了知識網絡空間內部知識單元團簇性與集聚性[22]。具有團簇性的知識單元之間緊密聯系,不同團簇之間的知識單元聯系稀疏?;谥R單元的這種團簇性可以將知識網絡空間劃分為若干具有相同知識主題的社區結構,可以認為知識網絡社區是知識網絡中觀視角下的知識主題表現形式,知識網絡社區的發展變化可以揭示領域研究主題的演化情況[23]。

本文選用由Newman[24]提出的基于模塊度的Fast GN(Girvan and Newman) 網絡社區發現算法識別網絡社區結構,該方法具有運行速度快、準確性高的優點。t時刻靜態知識網絡的知識網絡社區可以表示為其中,m為網絡社區數量。

2.4 計算網絡社區結構熵

網絡結構熵是從拓撲結構的角度發現網絡結構相關特征,并能夠定量化反映知識網絡全局特征信息的結構度量[25],對于理解知識網絡結構及知識網絡演化動力學具有重要作用。在復雜網絡中,結構熵與網絡結構分布的集中度、網絡各部分的差異性、網絡結構異構性成反比,與網絡結構穩定性、網絡結構均勻程度成正比[26-27]。

本文采用網絡社區結構熵[28]量化科學、技術、產業知識網絡的結構特征,不僅可以將知識網絡社區數量及規模信息融合,以表征全局網絡特征,同時結合時間序列可以形成網絡社區動態結構熵,能夠更好地反映科學、技術、產業知識網絡結構特征的動態變化及耦合關系。

網絡社區結構熵主要利用Fast GN 算法獲得的網絡社區及每個社區中的節點數量來計算,其計算公式為

其中,M(t)為t時刻網絡社區的數量;Nt為t時刻網絡規模;ci,t為t時刻網絡社區i中節點的數量。熵值越小,表示網絡社區結構分布越集中,各社區結構的差異性越大,網絡社區結構越不穩定;熵值越大,表示網絡社區結構分布越分散,各社區結構的差異性越小,網絡結構社區趨于均衡。

2.5 分割S、T、I知識網絡動態結構熵

考慮到S、T、I 三個知識網絡之間互動關系動態變化的差異性,需要以三類知識網絡社區的動態結構熵作為觀測值構建多元時間序列,并將其分割為若干具有統計特征的子序列,確保這些子時間序列的統計特征具有段內同質性、段間異質性的特點[29],以更好地探究S、T、I 知識網絡結構在不同時間階段的互動關系特點。

常見的分割方法主要面向一元(即單一觀測值)時間序列[30],這些方法無法適用多變量的多元時間序列,如果簡單地將每個變量按照一元時間序列分段,那么無疑會割裂各個變量之間的關系。為此,本文采用貪婪高斯分割算法(greedy Gaussian segmentation,GGS)[31]來實現對S、T、I 知識網絡動態結構熵進行定量化的多元時間序列分割,該方法使用自上而下的貪婪算法來檢測時間序列的分割點,具有較強的擴展性和適用性。其主要思路是將多元時間序列[E1,E2,…,Et] ∈R3×TL(其中,TL 表示時間序列的長度,時間t= 1,…,TL,3 表示科學、技術、產業三個網絡結構熵的時間序列)劃分為若干具有不同均值和協方差且符合多變量高斯分布的子時間序列,然后使用自上而下的迭代算法進行分割點搜索或邊界組合優化,獲取K-1 個分割點b1,b2,…,bK-1,最終將時間序列劃分為K個子時間序列。

2.6 利用傳遞熵測度驅動關系

傳遞熵(transfer entropy)是一種基于香農熵來檢測兩個系統之間定向信息傳遞的非參數信息度量方法,通過對系統的動力學及其耦合性質的最小假設,來量化兩個系統之間信息傳輸動態性及方向性[32],尤其是對于高度非線性或非高斯分布的數據,傳遞熵更適合量化系統間的因果關系[33]。在本文中,科學、技術、產業間的創新驅動關系是建立在科學、技術、產業知識網絡結構間的耦合關系之上,這種驅動關系具有明顯的方向性。因此,可以利用基于傳遞熵構建創新驅動關系的測度模型,以此獲得具體領域的科學、技術、產業之間的驅動關系。

設x、y為某一時間段內科學、技術、產業知識網絡中的任意兩個動態結構熵變量,那么該時間段中網絡結構y到網絡結構x的信息傳遞熵定義為

傳遞熵Ey→x反映了網絡結構y對x的不確定性大小的影響,即網絡結構y傳遞給x的信息量,也可以理解為網絡結構y的變化對于x變化的影響程度。因此,依據這個信息量可以判斷某個時間段內科學、技術、產業知識網絡中任意兩個對象之間的驅動關系,在此基礎上,可以構建該時間段內科學、技術、產業間驅動關系強度指數DIK,即

若Ey→x-Ex→y> 0,則網絡結構y與x存在驅動關系,y的變化會影響x的變化,即y為因,x為果;若Ey→x-Ex→y< 0,則網絡結構x與y存在驅動關系,x的變化會影響y的變化,即x為因,y為果;若Ey→x-Ex→y= 0,則網絡結構y與x互不影響,彼此之間不存在驅動關系[34]。利用驅動關系強度指數DIK既可以比較科學、技術、產業之間是否存在驅動關系,又可以判斷哪兩個對象在這段時間存在最為顯著的驅動關系(主要驅動關系),如果兩個對象的驅動關系最顯著,那么意味著這兩個對象在某個時間段內的知識創新活動前后推動的耦合關系明顯。

2.7 探測主要驅動關系下的知識傳遞路徑

利用科學、技術、產業之間的主要驅動關系,可以進一步從微觀層面探析科學、技術、產業間知識傳遞的主要路徑??紤]到互信息不僅可以度量兩個隨機變量相互共享的信息量[35],也可以用于反映知識傳遞過程中的繼承關系[36]。本文利用知識內容互信息,獲得某時間段內驅動關系最顯著的兩個對象之間知識耦合所形成的知識創新內容的主要繼承性傳遞路徑,本文將其稱為主要知識內容驅動路徑,以此探析科學、技術、產業間驅動發展過程中的知識內容變化特點。

設具有m個社區的知識網絡xm到ym的具有最大的驅動關系強度指數DIm=Exm→ym,主要分析步驟如圖2 所示。

圖2 基于互信息探測驅動路徑示意圖

Step1.計算社區間互信息,判斷知識主題間繼承性。

計算t時間點知識網絡xm的各個網絡社區Ct xm與t+1時間內知識網絡ym的各個網絡社區Cym t+1之間的互信息,計算公式為

其中,p(Nx,Ny)為網絡社區和中各個主題詞(節點)的聯合概率分布,p(Nx)、p(Ny)是邊緣概率分布。具有顯著驅動關系的兩個知識網絡xm、ym各社區間的互信息反映了這兩個領域知識主題之間的信息傳遞量?;バ畔⒃酱?,表明傳遞給的信息量越多,所代表的知識主題對所代表的知識主題繼承性越強;互信息越小,表明傳遞給的信息量越少,所代表的知識主題對所代表的知識主題繼承性越弱[36]。

Step2.識別最大互信息,發現具有顯著繼承關系的知識主題。

具有驅動關系的兩個知識網絡xm、ym各社區間的互信息值大小不一,這意味著主題間的繼承性具有差異性。最大互信息表示主題間具有最顯著的繼承性,利用這種顯著的繼承關系,有助于發現某時間段內主要驅動關系中具有顯著繼承性關系的知識創新內容的主要傳遞路徑。通過互信息值的對比分析,可以獲得時間段內t時間具有最大互信息的兩個網絡社區與的集合利用該集合可以形成t時間內知識網絡xm、ym之間主要繼承性知識傳遞路徑。

Step3.獲取具有顯著繼承關系的知識主題間的知識交集,得到具有顯著繼承性的知識內容。

網絡社區間的知識交集是信息共享的主要內容,具有最大互信息網絡社區間的知識交集是具有顯著繼承關系的知識內容,在此基礎上,可以獲得主要繼承性知識內容的傳遞路徑。具體來說,分別獲取t時間具有最大互信息的網絡社區與之間的主題詞交集Nt,t+1=這些主題詞表示了繼承性知識內容。最終獲得主題詞交集集合{N1,2,N2,3,…,Nt-1,t},由該集合形成了主要繼承性知識內容傳遞路徑。

Step4.計算繼承性知識內容間的相似性,分析知識內容的傳遞特點。

計算主要繼承性知識內容傳遞路徑中相鄰繼承性知識內容的相似性,可以分析繼承性知識內容的變化特點。如果繼承性知識內容的相似度逐漸變大,那么說明知識傳遞路徑上知識內容前后繼承關系逐漸增強,體現了兩個領域驅動過程中知識呈現會聚性[36];如果繼承性知識內容相似度逐漸變小,那么說明知識傳遞路徑上知識內容前后繼承關系逐漸減弱,體現了兩個領域驅動過程中知識內容發生轉折,新的知識內容可能出現。具體地,本文利用余弦相似度算法計算繼承性知識內容的相似性。

3 實證研究

再生醫學是面向受損(患?。┘毎?、器官、組織的再生、修復或替換的一門新興醫學,其中干細胞是再生醫學的核心內容,再生醫學(干細胞)逐漸成為現代臨床醫學中具有廣闊應用前景的研究領域,能夠促進醫學領域向嶄新的高度發展[37]。鑒于此,本文選用再生醫學(干細胞)領域作為科學、技術、產業間創新驅動關系識別方法的實證對象。

3.1 數據獲取及處理

針對再生醫學(干細胞) 領域,本文選用PubMed、Derwent Innovation 數據庫和Cortellis 數據庫分別作為獲取論文、專利、產品信息的數據來源。檢索時間為1997 年1 月1 日至2020 年12 月31日,分別獲取392683、44454、1347 條數據。如圖3所示,再生醫學(干細胞)論文和專利的數量一直處于增長狀態,尤其是專利數量自2014 年以來發展迅速,而產品的數量變化波動較大。

圖3 再生醫學(干細胞)論文、專利、產品數量變化

使用SemRep 文本處理工具和Pyhton 語言中的SpaCy 工具包對非結構化的摘要數據進行語料清洗、分詞、詞性標注、去停用詞等結構化處理,提取具有實體概念意義的主題詞,從科技論文、專利數據和產品數據中提取主題詞的數量分別為84473、55664、2896 個。

3.2 網絡社區分析

利用上述已獲得的數據,分別構建了從1997 年至2020 年共24 年的再生醫學(干細胞)科學、技術、產業知識網絡。圖4 展示了再生醫學(干細胞)產業知識網絡從1997 年至2020 年的變化。進一步分析S、T、I 知識網絡規模的變化(圖5)可知,S、T 知識網絡規模呈增長趨勢,說明該領域中科學研究和技術創新內容持續豐富;I 知識網絡規模發展呈現一定的波動,且知識網絡規模相對最小,說明該領域產業創新和開發的內容豐富度相對集中、有限。

圖4 再生醫學(干細胞)產業知識網絡演化(1997—2020年)

圖5 再生醫學(干細胞)科學、技術、產業知識網絡規模變化

通過Fast GN 網絡社區發現算法的計算發現(圖6),科學知識網絡的社區數量最多,表明再生醫學(干細胞)領域的科學研究主題最為豐富;產業知識網絡的社區數量維持在相對較低的水平,說明該領域產業研究內容相對較為集中。從總體來看,科學研究知識網絡中的社區數量變化以M 形曲線波動,且呈降低趨勢,說明科學研究知識網絡的研究主題在擴張與收斂的狀態中交替演化,研究主題內容整體上逐漸收斂,表明該領域科學研究的方向逐漸趨向集中。技術知識網絡中的社區數量也以M 形曲線波動,但是波動頻率和幅度相對科學研究知識網絡較低,說明該領域技術創新內容的擴張和收斂維持在相對穩定的范圍。產業知識網絡的社區數量變化波動相對較少,整體趨勢呈現水平方向波動,這再次表明該領域的產業創新和開發內容相對集中、有限。

圖6 再生醫學(干細胞)科學、技術、產業知識網絡社區變化

3.3 動態結構熵分析

圖7 是S、T、I 知識網絡社區動態結構熵分布圖,產業的知識網絡社區結構熵總體上高于科學、技術知識的結構熵,技術知識網絡次之,科學知識網絡結構熵最小,這說明再生醫學領域產業知識網絡中的網絡社區分散、各社區結構的差異性較小、知識社區網絡結構較為均衡??茖W知識網絡的網絡社區較為集中,各社區的差異性大,網絡社區結構不均衡,這進一步說明,再生醫學的產業研究分散,尚未形成特色鮮明的研究方向,而科學和技術的研究方向相對較為集中,各研究方向的內容差異性大。

圖7 科學、技術、產業知識網絡社區動態結構熵及分段

從圖7 可以看出,1997—2020年的知識網絡結構變化可以分為兩個階段,第一階段是1997—2001 年,第二階段是2002—2020 年。在第一階段(1997—2001 年),產業知識網絡的社區結構熵呈增長趨勢,技術知識網絡的社區結構熵呈降低趨勢,科學技術知識網絡結構熵呈水平發展趨勢,說明該階段產業研究方向分散、技術研究逐漸集中、科學研究較為穩定。在第二階段(2002—2020 年),產業知識網絡的社區結構熵在2002—2005 年呈現快速增長趨勢,2006 年之后的結構熵值在2.5~3.5 的范圍內上下波動,波動幅度較大,產業研究方向分散,研究特色不明顯;技術知識網絡的社區結構熵整體上呈現下降趨勢,波動幅度相對較小,科學知識網絡的社區結構熵整體上呈現上升趨勢、波動幅度最為平緩,科學和技術的研究方向集中且研究特色明顯。

3.4 驅動關系測度

(1)第一階段(1997—2001 年)的驅動關系測度。①科學與技術之間存在驅動關系??茖W知識網絡結構對技術知識網絡結構影響明顯,傳遞熵值為0.8113(表1);而技術知識網絡結構變化對科學知識網絡結構變化無影響,傳遞熵值為0。因此,科學對技術驅動作用明顯。②科學與產業之間不存在驅動關系。兩者之間的傳遞熵相同,科學知識網絡結構變化對產業知識網絡結構變化產生的影響與產業知識網絡結構變化對科學知識網絡結構變化產生的影響程度相同,雙方之間的驅動關系不明顯。③技術與產業之間存在驅動關系。尤其是產業知識網絡結構變化對技術知識網絡結構變化的影響相對明顯,傳遞熵值為0.1226;但是技術知識網絡結構變化對產業的知識網絡結構變化無影響,傳遞熵值為0。因此,產業對技術略有驅動作用。

表1 各時間段內科學(S)、技術(T)、產業(I)間的傳遞熵值

綜上,該時間段內科學知識網絡對技術知識網絡結構的驅動關系強度指數DI 最大,科學對于技術的驅動作用最為明顯。

(2)第二階段(2002—2020 年)的驅動關系測度。①科學與技術之間存在驅動關系。技術知識網絡結構變化對科學知識網絡結構變化影響明顯,傳遞熵為0.5943;而科學知識網絡結構變化對技術知識網絡結構的變化影響不顯著,傳遞熵僅為0.0111。因此,技術對科學的驅動作用明顯。②科學與產業之間存在驅動關系。產業知識網絡結構變化對科學知識網絡結構變化影響較為明顯,傳遞熵值為0.3055;而科學知識網絡結構變化對產業的知識網絡結構變化影響不顯著,傳遞熵僅為0.0111。因此,產業對科學具有一定驅動作用。③技術與產業之間不存在驅動關系。兩者之間的傳遞熵相同,技術知識網絡結構變化對產業知識網絡結構變化產生的影響與產業知識網絡結構變化對技術知識網絡結構變化產生的影響程度相同,雙方之間驅動關系不明顯。

綜上,該時間段內技術知識網絡對科學知識網絡結構的驅動關系強度指數DI 最大,技術對于科學的驅動作用最為明顯。

綜合來看,在再生醫學創新過程的第一階段,技術創新是主要的被驅動對象,科學對技術具有關鍵的驅動作用,產業對技術略有驅動作用;在第二階段,科學研究是主要的被驅動對象,其中技術對科學具有重要驅動作用,產業對科學具有一定驅動作用。

3.5 知識傳遞路徑分析

(1)第一階段(1997—2001 年)的知識傳遞路徑分析。該階段以科學驅動技術為主,通過計算該時間段內t年科學S 的各網絡社區與t+1 年技術T 的各網絡社區之間的互信息及交集主題詞數量(圖8)發現,S 與T 的最大互信息值呈現逐漸增大的趨勢,說明技術繼承自科學的知識內容的信息量逐漸增多;S 與T 之間具有最大互信息社區間的知識交集主題詞數量呈現逐漸增長的趨勢,說明科學向技術的主要知識傳遞過程中繼承性知識內容不斷豐富。

圖8 第一階段t年科學(S)與t+1年技術(T)在各社區間的最大互信息與交集主題詞數量

進一步分析科學驅動技術過程中繼承性知識內容的傳遞路徑(圖9)發現,時間相鄰的繼承性知識內容間的相似度由0.1655 逐漸變大為0.6957,說明科學驅動技術過程中知識傳遞路徑上知識內容前后繼承關系逐漸增強,知識會聚性趨勢明顯,也說明科學驅動技術的創新需要持續發揮。

圖9 第一階段科學驅動技術過程中繼承性知識內容的傳遞路徑

(2)第二階段(2002—2020 年)的知識傳遞路徑分析。該階段以技術驅動科學為主,通過計算該時間段內t年技術(T)的各社區與t+1 年科學(S)各社區之間的互信息及交集主題詞數量(圖10)發現,T 與S 的最大互信息值在21~23 的范圍內小幅波動,說明科學繼承自技術的知識內容的信息量維持在相對較為穩定的水平。

圖10 第二階段t年技術(T)與t+1年科學(S)在各社區間的最大互信息及交集主題詞數量

T 與S 之間最大互信息網絡社區的知識交集主題詞數量呈現波動變化的趨勢,說明在技術向科學的主要知識傳遞過程中繼承性知識內容范圍是不斷變化的,尤其是2004T—2007T 時間段繼承性知識內容范圍縮減明顯,2008T—2010T 時間段呈現擴大趨勢,2011T—2013T 時間段又呈現縮減趨勢,2015T—2018T 時間段呈擴大趨勢。從繼承性知識內容的范圍變化特點可以看出,技術驅動科學發展的過程中,技術創新對于科學研究的反饋存在更高的不確定性;繼承性知識內容范圍越擴大,反映出技術能夠反饋給科學研究的技術支持和需求導向更加廣泛,而繼承性知識內容范圍的縮減趨勢,反映出隨著技術的逐漸成熟,技術提供給科學研究的技術支持和導向逐漸匯聚。

進一步分析技術驅動科學過程中繼承性知識內容的傳遞路徑(圖11)發現,相鄰時間的繼承性知識內容間的相似度也呈現波動變化,但是具有波動幅度大、波峰高的特點,說明技術驅動科學過程中知識傳遞路徑上知識內容前后繼承關系的差異性變化明顯。其中,2003T—2006T 時間段繼承性知識內容相似度陡增,達到0.7523,說明該時間段內知識內容前后繼承關系逐漸增強、知識會聚性趨勢明顯;2006T—2008T 時間段繼承性知識內容相似度陡降,降至0.0024,說明該段時間知識內容前后繼承關系逐漸減弱,意味著技術驅動科學過程中知識內容開始發生轉折、新的知識內容可能出現;2008T—2011T 時間段繼承性知識內容相似度陡增,達到0.7379,說明該時間段內知識內容前后繼承關系逐漸增強、知識會聚性趨勢明顯;除2015T—2016T時間段外,2011T—2019T 時間段繼承性知識內容間相似度略有波動,但總體上維持在降低水平,說明在這段時間內,除了2015T—2016T 時間段繼承關系明顯外,知識傳遞過程中的前后時間的知識內容轉折明顯。

圖11 第二階段技術驅動科學過程中繼承性知識內容的傳遞路徑

總體上看,技術驅動科學過程中知識傳遞路徑上知識內容前后繼承關系的差異性變化明顯,表明技術向科學傳遞的知識內容是非連續的、動態的,這也說明此過程中技術對科學問題的技術支持和導向是動態變化的,預示著潛在顛覆性技術產生的可能。

3.6 實證結果的驗證

本文采用文獻調研與數據統計分析的方式對實證結果進行驗證。

(1)2001 年是再生醫學(干細胞)領域發展的重要時間節點,考慮到該領域面臨著嚴峻的人類倫理問題,時任美國總統George W. Bush 于2001 年出臺了限制干細胞研究的聯邦法案[38],這對該領域的科學研究帶來巨大影響[39]。這一重要時間節點與本文實證研究中知識網絡社區動態結構熵分割的時間節點相吻合。

(2)通過對現有文獻資料的梳理發現,2002 年以前再生醫學(干細胞)領域取得了許多重要科學突破,尤其是1997—2001 年干細胞領域以科學研究為主。例如,1997 年加拿大的Dominique Bonnet 和John Dick 研究發現癌癥是從偏離軌道的干細胞中生長出來的[40]; 1998 年生物學家James Alexander Thomson 以“胚胎干細胞”為題發表了發現人類胚胎干細胞的研究,2001 年第一個關于成人臍帶干細胞移植的研究被發表[41]。進一步利用Lens 數據開放平臺[42]檢索再生醫學(干細胞)的論文及專利數據分析發現(圖12),2002 年以前被專利引用的論文數量及施引專利數量增長率總體呈上升趨勢,這種引用關系也在一定程度上說明2002 年以前技術受科學研究影響越來越大;2002 年以后,被專利引用的論文數量及施引專利數量增長率總體呈下降趨勢,尤其是2006 年施引專利數量增長率首次進入負增長,從2011 年開始施引專利數量增長率持續以負增長下降,說明該領域科學研究對于技術創新的影響逐漸減弱。這一特征與兩個階段的驅動關系特點基本吻合。

圖12 1997—2020年再生醫學(干細胞)領域論文被引及施引專利增長率變化

(3)Bergman 等[43]研究發現,2001 年前后是干細胞技術發展的重要時間節點,尤其是自2000 年開始,干細胞技術的專利數量申請急劇增長[44]?,F有的干細胞專利申請內容及技術組合促使科學研究朝著特定的方向發展,特別是使科學研究更接近于臨床[45],這與實證分析中驅動關系測度相關研究發現基本吻合。

(4)Hu 等[46]從科學與技術相結合的視角探索再生醫學(干細胞)知識前沿的過程中發現,在2006 年、2011 年這兩個時間節點前后的知識內容發生了差異性變化,這與本文2002—2020 年時間段知識傳遞路徑的實證分析結果基本吻合。

3.7 與現有方法的對比

為了對本文方法的相對優勢進行驗證,采用基于網絡屬性Copula 熵的知識網絡間依賴關系非參數估計法[47]以及由Ghawi 等[48]提出的知識網絡間相似度測度法作為對照方法,分別測度科學、技術、產業之間的互動關系。第一種方法中,兩個網絡的Copula 熵值與0 值的距離越遠,兩者的相互依賴的關系越大。從圖13 可以看出,在點的規模、邊的規模和社區數量三類網絡屬性下S 與T 之間存在明顯的相關性,S 或T 與I 的相關性相對較低。利用第二種方法可以計算出t時間與t+1 相鄰時間下S、T、I 知識網絡間相似度(圖14),S 與T 之間的相似度較高,而S 或T 與I 的相似度較低。與本文方法對比發現,這些方法多從科學、技術、產業之間的關聯強度來測度三者之間的關系,強調更多的是三者之間一種線性或非線性的整體相關關系,較少考慮三者的時序關聯特征,忽視了三者之間互動關系的方向性的轉變特征。本文提出的識別方法通過分階段測度三者關系的強度及方向性,實現了對三者動態視角下關聯關系的特征分析。

圖13 基于網絡屬性Copula熵的科學(S)、技術(T)、產業(I)知識網絡關系測度

圖14 相鄰時間下科學(S)、技術(T)、產業(I)知識網絡間相似度

4 總 結

本文提出一套知識網絡視角下科學、技術、產業間創新驅動關系識別方法。該方法從知識網絡視角下,利用知識網絡結構間的耦合關系探究創新過程中科學、技術、產業三個系統間前后相互推動的驅動關系;利用網絡社區結構熵量化科學、技術、產業知識網絡的結構特征,結合時間序列形成的網絡社區動態結構熵,以反映知識網絡結構特征的動態變化;采用貪婪高斯分割算法,實現對科學、技術、產業知識網絡動態結構熵的定量化分割,從整體上把握科學、技術、產業三個知識網絡之間互動關系動態變化的不同階段特點;利用基于傳遞熵構建創新驅動關系的測度模型,實現了科學、技術、產業之間的驅動關系的測度,可以發現時間段內最為顯著的驅動關系,最后利用這種最顯著的驅動關系,可以進一步從微觀層面探析科學、技術、產業間驅動關系下知識傳遞的主要路徑。

本文選取再生醫學(干細胞)領域作為實證對象,驗證了本文方法的可行性,對實證結果的多維度驗證論證了方法的有效性。相較于已有研究,本文將對科學、技術、產業之間關系測度由線性或非線性的相關關系測度拓展到三者之間的具有方向性的驅動關系測度,這種驅動關系的探究推進了對科學、技術、產業間創新驅動的動力機制的認知。

此外,本文尚存在一定的局限性。首先,本文采用社區網絡結構熵來表征知識網絡結構特征,反映了介觀層面的知識網絡結構特點。未來,更全面的網絡結構特征表征需要兼顧微觀層面和宏觀層面的網絡結構熵;其次,知識網絡視角下科學、技術、產業間的驅動關系反映的是三者知識內容方面的繼承性耦合關系,但是三者之間驅動關系的形成,除了科學、技術、產業本身,還受到多種因素的影響,如科學、技術、產業創新主體之間的空間分布及合作特點。未來研究需要拓展到更多維度的創新生態視角。

猜你喜歡
繼承性網絡結構驅動
基于模糊PI控制的驅動防滑仿真系統分析
屈宏斌:未來五年,雙輪驅動,砥礪前行
軌旁ATC系統門控柜接收/驅動板改造
園林建筑的繼承與創新
煙臺剪紙藝術文化的繼承性再思考
淺述藝術發展繼承與創新的關系
草酸鈷制備中的形貌繼承性初探
基于S3C6410的Wi-Fi驅動移植實現
基于互信息的貝葉斯網絡結構學習
知識網絡結構維對于創新績效的作用機制——遠程創新搜尋的中介作用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合