?

大數據分析技術在多媒體信息處理中的應用
——以專利信息視角為例

2022-11-16 03:55符川川
經濟與管理 2022年6期
關鍵詞:專利技術信息處理專利申請

符川川

(南京大學 信息管理學院,江蘇 南京 210023)

一、引言

近年來,全球化進程加速,新一輪科技革命競爭日益激烈,專利申請成為展現國家科技創新能力的重要手段。不少國家和地區及時洞察到這一發展態勢,并加大專利申請投入,以便形成系統的專利布局。我國為占領科技創新驅動產業變革的戰略制高點,明確把數字創意產業作為戰略性新興產業的發展任務,并實施了一系列激勵政策促進數字產業的專利申請,以提高在該領域的國際競爭力。大數據分析技術是一種建立在海量數據基礎上的新興數據分析方法,其利用數據挖掘和機器學習從結構化、半結構化以及非結構化的數據中挖掘隱含的文本、語音、圖像等信息,從而實現大規模數據的處理分析、規則挖掘和模型預測,對加速數字創意產業的跨越式發展大有裨益。多媒體信息處理的快速普及和飛速發展使得數字聲音、數字圖像、數字視頻等成為大數據分析技術的主要作用對象,并將數據標注和語義分析再翻譯成人類理解的信息,為不斷優化多種深度神經網絡模型處理指數級增長的文本、聲音、圖像等信息提供增強算力。透過專利信息視角研究大數據分析技術在多媒體信息處理中的應用對于洞察專利分布、合理布局數字產業具有重要意義。

大數據分析技術在多媒體信息處理中的應用進入快速發展時期,其逐漸成為學界和工業界的研究熱點,國內外有關大數據分析技術在多媒體信息處理中應用的研究主要集中在以下三方面。第一,文本信息處理技術在多媒體信息處理中的應用,大多基于文本信息處理技術抽取多媒體信息特征并挖掘本質信息。在信息檢索領域,提出了有監督的詞袋模型以提高多媒體信息檢索的精確度并減少檢索耗時[1];在自動摘要領域,構建了文本自動綜述系統模型以抽取多媒體信息中的關鍵內容并合成摘要[2];在多媒體信息要素抽取領域,提出了Golay Code 算法從多媒體數據集中的元知識提取元特征來研究數據點之間的關系模式[3];在新媒體交互式監管領域,利用大數據分析技術將新媒體內容進行過濾、排重、分類,從而形成監控信息樹[4]。第二,語音信息處理技術在多媒體信息處理中的應用,大多基于語音信息處理技術對多媒體信息特征進行分類。在語音聲調識別領域,提出K-means 初始化EM 算法進行語音聲調識別仿真[5];在語音情感識別領域,構建LDA-kernel-KNNFLC 模型用于學習語音情感數據庫的特征空間以實現識別語音情感[6],探究了中間匹配內核(IMK)的分類器性能以進行語音情感識別[7],優化了支持向量機(SVM)對特征向量集的長時語音的變化長度模式以進行語音情感分類[8]。第三,圖像信息處理技術在多媒體信息處理中的應用,大多基于圖像信息處理技術對多媒體信息內容進行特征抽取。在圖片聚類領域,借鑒超圖非負矩陣分解模型對無標簽圖片進行預處理以提高聚類精確度[9];在圖像加密領域,提出LSIC 模型進行灰度和彩色圖像加密[10],優化了安全圖像密碼系統并進行深入的安全分析[11];在視頻場景檢測領域,改進頻譜聚類方法以有效地總結每個鏡頭的內容并準確地檢測大多數場景邊界[12];在圖像的人機交互領域,以多分辨率紋理圖像信息(MRTII)的新特征抽取算法表征和分類人眼對頻譜圖像的不同情感[13]。

通過文獻梳理發現,專利信息視角下的大數據分析技術發展及演進頗受關注,研究內容包括:基于專利地圖探索大數據技術在各國的發展現狀[14],基于專利分析我國大數據產業在國內和國外的競爭態勢[15],基于專利可視化和產業動態探究大數據領域技術創新的演進[16],基于專利視角預見大數據產業技術路線圖[17]等?;趯@畔⒁暯菑暮暧^層面探析大數據分析技術的演進研究比較豐富,但探索微觀層面的研究有進一步提升的空間。因此,分析專利申請時間、地區、技術內容等微觀內容有助于更全面細致地了解大數據分析技術在多媒體信息處理中的應用,并把握未來技術發展趨勢。本研究采集大數據分析技術在多媒體信息處理應用中的相關專利,針對專利現狀、專利技術主題、專利申請人、重點專利等微觀內容進行分析,以期明晰該領域專利分布情況,為我國數字產業的專利布局建言獻策。

二、數據來源與檢索

從湯森路透專利數據庫(Thomson Reuters Integrity)下載得到1 085 件大數據分析技術在多媒體信息處理應用中的專利,包括全球收錄專利的116 個國家和地區。在獲取初始專利后對其進行檢索設置,并進行相應的去重處理。本研究經過篩選得到956 件同族專利,檢索方式如表1 所示。

表1 檢索方式

三、專利現狀分析

(一)發展階段分析

利用專利申請量隨時間的推移而變化來分析當前技術領域發展所處階段。由圖1 可知,1995—2005 年,全球的大數據分析技術在多媒體信息處理應用中的專利申請量緩慢增長,個別年份沒有專利申請,年平均申請量不足2 件,處于萌芽期。2006—2017 年專利申請量快速增長,尤其在2013—2015年專利申請量成倍增長,處于成長期。2017—2018年專利申請量增幅有所放緩,處于成熟期。2018—2020 年專利申請量降幅明顯,處于衰退期,本領域的技術在該階段競爭激烈,需要提前進行預警,避免不必要的研發投入。

圖1 全球專利申請量

(二) 專利申請量地域分布分析

1.專利技術來源國/地區排名分析。分析大數據分析技術在多媒體信息處理應用中的專利技術優先權國家/地區(即技術來源國/地區),可以挖掘該領域特定技術的創新潛質和落地可能,同時也可以追蹤持有特定技術的研發部門的聚集區。圖2 顯示世界知識產權五局以及中國臺灣地區的專利申請情況。由圖2 可知,中國、韓國、美國、日本、中國臺灣、法國排名前六位,其中中國的專利申請量占據絕對的數量優勢,該優勢得益于中國早期的專利布局,這也反映了中國大數據分析技術在多媒體信息處理中的應用已經進入“中國創造”階段。中國在該領域可以抓住專利提前布局的時機,將一些核心技術落地并形成產業化以搶占國際競爭制高點。

圖2 專利技術來源國/地區專利申請數量

2.專利技術在世界知識產權五局的流向。通過分析該領域的授權專利在中國、美國、歐洲、日本、韓國世界知識產權五局的流向可以獲取五局的專利優先權情況以及專利布局情況。由圖3 可知中國的專利優先權最多,遠高于其他四個專利局,但是中國的專利大部分布局在國內,很少布局在國外。美國、韓國、日本雖然專利優先權較少,但是大部分布局在中國。上述現狀的原因在于,中國市場相對開放,對國內和國外專利權限的地域性限制較少;中國的專利申請時間相對短于國外并且申請難度也低于國外。此外,中國的部分專利申請人重數量,輕質量。因此,該領域中國的專利質量同國外相比有一定差距。為打開該領域專利的國際市場并提高競爭力,需要國內專利申請人提前進行專利布局并提高申請專利的質量。

圖3 專利技術的五局流向

3.我國各省的專利申請量。進一步縮小檢索范圍可獲知我國各省市在該領域的專利申請情況,從而洞悉各省市的科技創新能力以及對科技的重視程度。檢索后統計分析可知,該領域專利申請量排名全國前十位的省市分別為北京、廣東、江蘇、上海、山東、四川、安徽、浙江、湖北以及天津。這些省市表現出活躍的科技創新能力,其中大部分位于長三角、珠三角、京津冀三大經濟帶上;這些省市的當地政府足夠重視該領域專利的申請,表現為對專利申請費、審查費、年費、復審費等費用的減繳;降低專利申請人準入門檻,施行專利申請的揭榜掛帥制度;對向國外申請該領域專利的組織或個人等,給予優惠政策以激勵高質量專利的申請。

四、專利技術主題分析

(一) 專利技術構成分析

對大數據分析技術在多媒體信息處理應用的專利技術構成進行分析,其重點在于分析該領域主要技術分支的覆蓋情況并深化對特定技術創新程度的了解,從而挖掘隱含的專利技術空白點以提前作好專利布局。圖4 表征各分類號對應特定技術的專利情況。排名前十位的分別為G06F17、H04L29、G06Q50、G06Q10、G06K9、G06F16、G06Q30、H04L12、H04N21、H04N7,對應著特定功能的數字計算設備或數據處理設備或數據處理方法、特定商業領域的系統或方法、閱讀或識別印刷或書寫字符或者用于識別圖形、信息檢索、數據交換網絡、交互式電視等。由此可知,特定功能的數字計算設備或數據處理設備或數據處理方法引領著多媒體信息處理,該技術蘊含著巨大的經濟利益,可以為投資者提供一定的決策參考。

圖4 技術構成

(二)專利重要技術地域分布

基于對大數據分析技術在多媒體信息處理應用中專利技術構成的分析,本研究對重要技術在主要國家的分布進行分析。由圖5 可知,氣泡越大表明該國擁有的專利技術越多。根據氣泡大小可知,上述全球排名前十的技術專利大部分分布在中國、美國、韓國;中國在該領域的關鍵技術的專利數量大于美國和韓國,在該領域有著較強的競爭力,也反映中國的科技戰略在該領域已初見成效。

圖5 重要技術分支地域分布

五、專利申請人分析

(一)專利主要申請人分析

根據特定公司擁有大數據分析技術在多媒體信息處理應用中的專利數量可以研判該領域的競爭對手,并進行風險規避。由圖6 可知,專利優先權排名前十位的分別為國家電網公司、騰訊科技(深圳)有限公司、聯想(北京)有限公司、上海市電力公司、北京易游華成科技有限公司、北京字節跳動網絡技術有限公司、南方電網深圳數字電網研究院有限公司、中國移動通信集團公司、北京派瑞根科技開發有限公司、深圳供電局有限公司。進一步分析發現,該技術領域的競爭不在國外,主要集中在國內,主要專利權擁有者的積極競爭有利于該領域技術在國內的發展。因此,為了提升在該領域的競爭力,有必要提前在國外進行專利布局。

圖6 專利主要申請人

(二)專利合作申請分析

當上述專利競爭達到一定強度時會阻礙創新技術的發展,不斷設置專利圍欄會給后進者帶來極高的成本,反而不利于專利的申請。合作申請專利則可以減少專利申請的代價,因此,有必要合作申請專利。分析專利申請人的合作網絡可以發現潛在的合作對象。由圖7 知,國家電網公司與其他公司合作申請的該領域專利較多,較多的合作專利有利于其向國外布局該領域專利。

圖7 專利合作申請

六、重點專利分析

(一)被引用專利分析

一般情況下,專利被引用的次數越多則該專利的質量和經濟價值越高,其影響力也就越大,進而成為核心專利。由表2 可知,被引專利最多的專利號分別為 CN101262494A、US20170235848A1、CN105187771A、CN104573619A、CN102945027A、CN104796485A、CN101025737A、CN103838617A、CN105678398A、CN104917669A。這些專利是大數據分析技術在多媒體信息處理應用中的核心專利,其中華為技術有限公司被引用次數最多,表明該公司是本領域的領軍者,能為后續專利申請人指明方向。

表2 專利被引次數

(二)專利權利要求數量分析

大數據分析技術在多媒體信息處理應用中的專利權利要求數量越多則其技術范圍越廣,專利家族越大,其他新申請的專利難以繞過,那么專利質量就越高。由圖8 可知,專利權利要求數量排名前十的專利號分別為CN110073301A、CN1294812A、CN1183841A、CN103339913A、CN104254863A、CN105229687A、CN109219801A、CN1672178B、CN1568466A、CN1049 51077A,對應的權利要求數量(項)分別為1 442、352、292、260、190、94、60、59、58、42,其中強力物聯網投資組合2016 有限公司的專利權利要求數量最多,其擁有的專利技術范圍較廣,同行難以繞過,因此該公司具備較強的科技競爭力。

圖8 專利權利要求數量

(三)專利創新詞云分析

借助對該領域重點專利的創新詞云分析可以抽取該領域的技術主題詞,并逐步探索該領域的研發重點以及未來的風向。本研究進行中文分詞、英文切詞等預處理,并清洗一些噪音數據?;诖?本研究應用機器學習算法對該領域的專利文本進行聚類,并可視化專利的關鍵詞。由圖9 可知基于多媒體、服務器、數據庫、多媒體信息、數據采集、互聯網、大數據分析技術、管理系統、分布式、數據存儲等關鍵詞的專利數量最多,表明基于這些關鍵詞的專利屬于該領域的核心專利。

圖9 創新詞云

(四)專利地圖分析

通過專利地圖可視化探析該領域的重點專利技術布局,專利地圖①由國際專利分類號聚類生成地形,在此基礎上,對重點專利進行文本分析并抽取標簽詞。其中,專利地圖的高峰表示重點專利技術聚集的區域,低谷反映該領域屬于空白,可以提前進行專利布局。專利地圖可表征該領域的高價值專利,經過聚類抽取的主要標簽分別為客戶、全景、決策、評估、廣告,電視、機器人、廣播、日志、重現,圖書館、多媒體系統、云端、黃頁、走失,遙控、節點、衛士、消息、網關,通信、無線、智能家居、功能、接口,模型、構建、數據挖掘、一體化、二維碼,輿情、航空、評價、臨床、存儲?;谶@些標簽專利屬于該領域的熱點專利,具有客觀經濟和技術價值。

七、結論和建議

本研究基于專利信息視角探索大數據分析技術在多媒體信息處理中的應用。從專利現狀分析、專利技術主題分析、專利申請人分析、重點專利分析四個角度進行有關技術應用的解析,得出的結論和相應政策建議如下:

第一,分析該領域專利的現狀可知,全球在該領域的專利申請量降幅比較明顯,但是我國在該領域專利申請量占據較大份額。該領域在我國已經進入“中國創造”階段。我國在該領域的專利申請量主要集中在三大經濟帶上。我國在該領域的專利大部分布局在國內?;诖?我國需要加大對該領域關鍵性技術的研發投入,提高專利審查員和專利申請人的業務素質以提升授權專利的質量,從而在國外布局該領域的專利中搶占市場先機。

第二,對該領域的專利技術主題進行分析可知,該領域主要對應著特定功能的數字計算設備或數據處理設備或數據處理方法、特定商業領域的系統或方法、閱讀或識別印刷或書寫字符或者用于識別圖形、信息檢索、數據交換網絡、交互式電視等。未來的技術空白點可能是上述某一技術的深化或者若干技術的組合。為提高該領域專利授權率,需要分析上述技術構成并挖掘上述技術以外的空白點,而挖掘技術空白點可以催生出一些新興產業。因此,需要培養交叉型復合人才以洞悉該領域的空白點。此外,重要技術主要集中在中國、美國和韓國,但是中國的這些重要技術在國外專利授權率較低,需要加強原始創新以提高專利質量。

第三,對專利申請人進行分析可知,該領域的主要專利申請人集中在我國的企業,我國企業在全球具有較強的競爭力;國內在該領域的專利合作者主要集中在國家電網公司。為提高我國在該領域的技術競爭力和話語權,需要轉變“重數量輕質量”的專利申請模式,并積極同國外專利申請者合作,促進我國從專利大國邁向專利強國。

第四,對重點專利進行分析可知,基于多媒體、服務器、數據庫、多媒體信息、數據采集、互聯網、大數據分析技術、管理系統、分布式、數據存儲等關鍵詞的專利屬于該領域的核心專利?;诖?需要敏銳地洞察一些專利的分項技術是否屬于上述關鍵詞所涉及的技術,從而研判這些專利是否為重點專利,并進行技術生命周期分析以決定是否值得進入。

注釋:

①因版面所限,專利地圖未標出。

猜你喜歡
專利技術信息處理專利申請
公民作為專利申請人的創造性自我初評
防爆電機專利技術發展綜述
東營市智能信息處理實驗室
全新充電專利技術實現車隊充電
基于Revit和Dynamo的施工BIM信息處理
唑啉草酯中國專利申請分析
低壓差線性穩壓器專利技術綜述
地震烈度信息處理平臺研究
CTCS-3級列控系統RBC與ATP結合部異常信息處理
曲面顯示器的專利技術分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合