?

30 年來基于計算機視覺的農業科技研究綜述*
——以CNKI 文獻關鍵詞詞頻分析為技術方法

2024-03-22 09:05馮祥勝
南方農機 2024年6期
關鍵詞:條數神經網絡計算機

巢 品 ,馮祥勝

(南昌工程學院信息工程學院,江西 南昌 330099)

計算機視覺(Computer Vision, CV)是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等,并將其處理成為更適合人眼觀察或傳送給儀器檢測的圖像[1]。計算機視覺自20 世紀60 年代中期發展起來,目前已能在相當程度上模擬人類視覺的優越能力,并在一定程度上彌補人類視覺的缺陷,所以被廣泛應用于天文學、地質學、氣象學、軍事科學、醫學、工農業生產等諸多領域。我國是農業大國,農業科技是農業發展的強勁引擎,農業科技研究一直是我國學術研究的重要領域之一。計算機視覺與農業科技研究的交叉,或者說基于計算機視覺的農業科技研究,也形成了較為豐厚的研究成果。在中國知網(CNKI)中,王金滿等聯合署名發表在《東北林業大學學報》1993 年第2 期的《木材構造計算機視覺分析方法》[2],是基于計算機視覺的農業科技研究的最早文獻。以此算來,我國基于計算機視覺的農業科技研究已有30 多年的歷史。關鍵詞詞頻分析法,是通過關鍵詞在某研究領域文獻中出現的頻次高低來揭示該領域研究熱點、動態及進展的文獻計量方法[3]。這種分析方法雖然是一種擱置了內容和意義的形式分析,但也是一種超越了個人經驗和主觀偏好而趨向客觀性的學術分析方法[4]?;诖?,本文試圖以關鍵詞詞頻分析為技術方法,綜述國內30 年來基于計算機視覺的農業科技研究成果,以期為后續研究提供一定參考或借鑒。

1 文獻數據來源及總體樣態

本研究文獻數據檢索于中國知網(CNKI)。一般認為,以“篇名”為檢索項進行文獻檢索獲得的文獻更具有直接相關性[5]。2023 年2 月26 日,在中國知網(CNKI)中,通過高級檢索功能,以“計算機視覺”為題名,文獻分類選定為“農業科技”專輯,時間范圍以2022 年12 月31 日為終止時間(不設定起點時間),共檢索到264 條學術期刊中文文獻及129 條學位論文中文文獻,兩類文獻合計393 條。經系統的主題閱讀,這393 條文獻中沒有會議紀要、課題成果介紹、書評等無效文獻,均為有效文獻。這393 條文獻即為本文的研究樣本。

根據CNKI 對文獻作出的分類,農業科技這一專輯包含農業基礎科學、農業工程、農藝學、植物保護、農作物、園藝、林業、畜牧與動物醫學、蠶蜂與野生動物保護、水產和漁業10 個專題。CNKI 顯示,這10個專題均有一定文獻,具體為:農業基礎科學82 條、農業工程45 條、農藝學8 條、植物保護53 條、農作物72 條、園藝76 條、林業21 條、畜牧與動物醫學33 條、蠶蜂與野生動物保護5 條、水產和漁業48 條。因為有些文獻被歸類到2 個或2 個以上專題,所以10 個專題的文獻累計條數多于393 條。這說明現有研究已涉及農業科技這一專輯的各個專題,但相對而言,農業基礎科學、農作物、園藝這3 個專題的研究較多,農藝學、蠶蜂與野生動物保護這2個專題的研究則較少。

各年度文獻條數如下:1993(1)、1994(0)、1995(2)、1996(3)、1997(2)、1998(3)、1999(3)、2000(3)、2001(2)、2002(2)、2003(8)、2004(4)、2005(22)、2006(5)、2007(12)、2008(8)、2009(9)、2010(6)、2011(10)、2012(7)、2013(13)、2014(8)、2015(13)、2016(16)、2017(32)、2018(35)、2019(47)、2020(44)、2021(37)、2022(36)。括號前數據為年份,括號內數據為文獻數目,下文相同。由此可見,1993—2004 年,除2003 年文獻條數為8 條外,其他各年度文獻條數均不超過4 條;2005 年文獻條數有突發性的增長,從2004 年的4 條陡然增長到2005 年的22條,但2006 年又回落到5 條;2007—2016 年各年度文獻條數在6~16 條之間,有一定波動,但總體而言高于1993—2004年各年度文獻條數;2017—2022年各年度文獻均在30 條以上。經分析,2005 年文獻條數有突發性的增長,可能與我國延續數千年的農業稅在該年度被廢除有關,農業稅的廢除不只是體現了黨和國家對廣大農民的愛護和關懷,引發了社會各界對農業、農村、農民的關注,也引發了學界對農業科技的關注。2017 年文獻條數較多,并一直延續到現在,則是因為2016年AlphaGo打敗世界頂級圍棋棋手李世石,引發了人工智能研究的熱潮,計算機視覺作為人工智能的重要領域之一,理所當然也得到了更多學者的關注。

2 基于計算機視覺的農業科技研究高頻關鍵詞詞頻統計

關鍵詞出現頻次的高低,反映該關鍵詞所指向問題的受關注程度,高頻關鍵詞表征該領域研究熱點問題所在。按393 條文獻作者所給出的關鍵詞進行統計,共獲得961 個關鍵詞,累計出現頻次為1 753 次,篇均4.46 次。本文的研究對象是基于計算機視覺的農業科技,“計算機視覺”(包括“計算機視覺法”“計算機視覺技術”等)毫無疑問出現頻次最高,共出現301 次。因此,為減少敘述上的重復,本文此后所說的高頻關鍵詞不再涉及“計算機視覺”。本文按照高頻關鍵詞選擇的標準——高頻詞累計頻次達到總頻次的40%左右[6],得到高頻關鍵詞32 個(詞頻≥5),具體情況如表1所示。

表1 1993—2022年基于計算機視覺的農業科技研究高頻關鍵詞

由表1 可知,基于計算機視覺的農業科技研究高頻關鍵詞分布較為廣泛,說明現有研究熱點較多。為更清晰顯示現有研究熱點的類別,本文參照張勤等[7]的關鍵詞分類方法,結合本研究的實際情況,對高頻關鍵詞進行應用屬性、方法屬性、技術屬性3 個方面的屬性分類,結果如表2 所示。由表2 可知,現有基于計算機視覺的農業科技研究在應用屬性方面的高頻關鍵詞有“水產養殖”“水稻”“農業”“棉花”“農業自動化”“番茄”“芒果”“農業生產”“農業工程”“蘋果”10 個,這表征的是計算機視覺主要在農業科技哪些領域獲得應用;在方法屬性方面的高頻關鍵詞有“圖像處理”“特征提取”“圖像分割”“目標檢測”“檢測”“圖像識別”“分級”“識別”“行為識別”“品質檢測”“采摘機器人”“模型”“品質”“顏色特征”“紋理特征”15 個,這表征的是計算機視覺主要通過哪些研究方法應用在農業科技領域中;在技術屬性方面的高頻關鍵詞有“深度學習”“支持向量機”“卷積神經網絡”“神經網絡”“BP 神經網絡”“人工神經網絡”“機器學習”7 個,這表征的是計算機視覺主要是哪些技術被應用于農業科技領域。

表2 1993—2022 年基于計算機視覺的農業科技研究高頻關鍵詞屬性分布

3 基于計算機視覺的農業科技研究縱向觀察

為顯示該領域研究的縱向發展脈絡,本文將近30 年的文獻劃分為3 個時段,即1993—2002 年、2003—2012 年、2013—2022 年。這3 個時段的文獻條數分別為21 條、91 條、281 條,可見該領域研究在穩步發展。

按高頻詞選擇標準分別統計各個時段的高頻關鍵詞,結果如表3 所示。由表3 可知,1993—2002 年高頻關鍵詞共有5 個,其中在應用屬性方面的高頻關鍵詞有“梨”和“木材構造”,在方法屬性方面的高頻關鍵詞有“圖像處理”和“特征提取”,在技術屬性方面的高頻關鍵詞有“人工神經網絡”;2003—2012年高頻關鍵詞共有15 個,其中在應用屬性方面的高頻關鍵詞有“農業工程”“番茄”“水產養殖”“魚類行為”,在方法屬性方面的高頻關鍵詞有“圖像處理”“檢測”“識別”“分級”“特征提取”“顏色特征”“圖像分割”“顏色”,在技術屬性方面的高頻關鍵詞有“BP 神經網絡”“人工神經網絡”“神經網絡”;2013—2022 年高頻關鍵詞共有22 個,其中在應用屬性方面的高頻關鍵詞有“水產養殖”“水稻”“棉花”“農業”“芒果”“農業生產”“農業自動化”,在方法屬性方面的高頻關鍵詞有“圖像處理”“圖像分割”“特征提取”“目標檢測”“圖像識別”“行為識別”“檢測”“采摘機器人”“分級”“模型”,在技術屬性方面的高頻關鍵詞有“深度學習”“支持向量機”“神經網絡”“卷積神經網絡”“機器學習”。由此可見,無論是分別從應用屬性、方法屬性、技術屬性來看,還是綜合從這三個屬性來看,基于計算機視覺的農業科技研究都在不斷豐富和拓展。

表3 基于計算機視覺的農業科技研究各時段高頻關鍵詞

4 基于計算機視覺的農業科技研究橫向觀察

橫向觀察是指在某特定時間內對若干個對象同時進行觀察記錄,將觀察結果進行比較,從而全面了解被觀察對象的一種觀察方法。為了達到對基于計算機視覺的農業科技研究橫向觀察的目的,本文參照董瑞蘭、周愛民等對關鍵詞作出的劃分[8-9],結合本研究實際情況,將關鍵詞分為恒星關鍵詞、流星關鍵詞、新星關鍵詞、衛星關鍵詞、彗星關鍵詞共5 類。其中,恒星關鍵詞是指在1993—2002年、2003—2012年、2013—2022 年三個時段均出現,頻次較高且相對穩定的關鍵詞;流星關鍵詞是指在1993—2002 年和(或)2003—2012 年出現且頻次較高,而在2013—2022 年時段中頻次明顯減少甚至頻次為0 的關鍵詞;新星關鍵詞是指在1993—2002 年和2003—2012 年兩個時段中出現頻次很低,但在2013—2022 年時段中頻次突增的關鍵詞;衛星關鍵詞是指在1993—2002年時段中出現頻次較高,在2003—2012 年時段中出現頻次較低,在2013—2022 年時段中出現頻次又較高的關鍵詞(就像衛星運行一樣,開始在某軌道運行速度很快,但為了轉到另一軌道運行,需要減速變軌,變軌完成后速度就會再次提升);彗星關鍵詞是指在三個時段的某一時段出現過,但頻次極低的關鍵詞。對961個關鍵詞一一分析統計,得到結果如下。

恒星關鍵詞:“圖像處理”“特征提取”。這表明“圖像處理”和“特征提取”一直是該領域的研究熱點,或者說這是該領域的恒定選題。

流星關鍵詞:“木材構造”“人工神經網絡”“農業工程”“顏色”“梨”。這幾個關鍵詞成為流星關鍵詞的原因分析如下:1)“木材構造”對木材的研究較為細化,實際上之后關于木材的研究還有多項,但關鍵詞不是“木材構造”,而是“木材”“木材識別”“木材檢尺”“木材生長輪材質分析”“原木材積”等;2)“人工神經網絡”指稱較為廣泛,因此被更為具體的“BP 神經網絡”“卷積神經網絡”等取代;3)“農業工程”也是指稱較為廣泛,因此在之后的研究中被細化為“農業生產”“農業自動化”等;4)“顏色”研究指向不明,因此在之后的研究中被有明確所指的“顏色特征”“顏色模型”“葉面顏色”“果實表面顏色”“食物顏色”“背景顏色”“顏色分級”“顏色空間”等取代;5)“梨”的品種指向不明,因此在之后的研究中被“碭山酥梨”“庫爾勒香梨”等取代。因此,這幾個流星關鍵詞的存在,并不是說這幾個關鍵詞所指向的問題真的不再有人關注了。

新星關鍵詞:“深度學習”“支持向量機”“卷積神經網絡”“目標檢測”“圖像識別”“神經網絡”“水稻”“行為識別”“棉花”“農業”“采摘機器人”“機器學習”“芒果”“模型”“農業生產”“農業自動化”等。新星關鍵詞越多,表明該研究領域在不斷涌現新的研究熱點。

衛星關鍵詞:無。表明該領域研究所關注的問題在研究方面整體上都在穩步發展,也就是說,沒有哪個問題在興起研究熱潮之后,有暫時性的退潮,之后又再一次地進入研究熱潮。

彗星關鍵詞:共有781 個關鍵詞在1993—2022年僅出現1 次,可認為是該研究領域的彗星關鍵詞,比如“3D”“‘次郎’甜柿”“Bayes 判別”“COMS 傳感器”“DS 融合理論程序”“Fisher 向量”“擺尾頻率”“跛行奶?!薄俺墒旆炎R別”等。彗星關鍵詞多,說明現有研究主要是拓展性的研究,包括在研究領域、研究方法、研究技術等多方面的拓展,而不是在已有研究基礎之上的提升研究。當然,課題組發現也有一些彗星關鍵詞是文獻作者命名不規范所致。

5 基于計算機視覺的農業科技研究高質量觀察

所有的學術文獻均有一定的學術價值,但學術文獻的學術價值也存在一定的差異。學界在考查文獻質量高低的時候,文獻的被引用情況被作為一項重要觀察指標。具體而言,就是具有更高引用頻次的學術論文即高被引論文,具有更高的學術價值??紤]到本次檢索到的文獻只有393 條,如果按照通行的高被引論文的標準——某一領域被引頻次位于該領域所有論文前1%的論文,則只有4 篇論文能作為高被引論文,所以本文參考張壘[10]的做法,適當降低高被引論文的標準,將被引頻次位于前3%的論文作為高被引論文。表4 列出了按此標注檢索出的12 篇高被引論文。

表4 基于計算機視覺的農業科技研究高被引論文及其關鍵詞

綜合表4 和表1 來看,高被引論文中有7 條文獻(即第1、2、3、5、6、7、8 條)的關鍵詞,包含1~2 個1993—2022 年時段的高頻關鍵詞,說明這些文獻極有可能是因為抓住了研究熱點,所以之后研究這些問題的學者因為“熱點”而參閱并引用這些文獻;但是,也有5 條文獻(即第4、9、10、11、12 條)的關鍵詞,并沒有出現1993—2022 年時段的高頻關鍵詞,說明這些文獻不是抓住了研究熱點,而是因為其他原因,比如優秀的實驗設計、嚴謹的理論建構等,而被其他研究者參閱并引用。當然,抓住了研究熱點的高被引論文,也有可能同時具有優秀的實驗設計、嚴謹的理論建構等特點。

6 結論

讓數據說話——這是本文的基本立場。本文以CNKI 文獻關鍵詞詞頻分析為技術方法,綜述30 年來基于計算機視覺的農業科技研究,發現了以下有意義的事實:

1)現有研究主要在“水產養殖”“水稻”“農業”“棉花”“農業自動化”“番茄”“芒果”“農業生產”“農業工程”“蘋果”等應用領域展開;

2)現有研究論及的基于計算機視覺的農業科技研究方法關鍵詞主要有“圖像處理”“特征提取”“圖像分割”“目標檢測”“檢測”“圖像識別”“分級”“識別”“行為識別”“品質檢測”“采摘機器人”“模型”“品質”“顏色特征”“紋理特征”等;

3)現有研究主要探討了“深度學習”“支持向量機”“卷積神經網絡”“神經網絡”“BP 神經網絡”“人工神經網絡”“機器學習”等計算機視覺技術在農業科技領域的應用;

4)無論是分別從應用屬性、方法屬性、技術屬性來看,還是綜合從這三個屬性來看,基于計算機視覺的農業科技研究都在不斷豐富和拓展;

5)“圖像處理”和“特征提取”是基于計算機視覺的農業科技研究的恒定選題;

6)基于計算機視覺的農業科技研究新的研究熱點有“深度學習”“支持向量機”“卷積神經網絡”“目標檢測”“圖像識別”“神經網絡”“水稻”“行為識別”“棉花”“農業”“采摘機器人”“機器學習”“芒果”“模型”“農業生產”“農業自動化”等;

7)現有基于計算機視覺的農業科技研究主要是拓展性的研究,包括在研究領域、研究方法、研究技術等多方面的拓展,而不是在已有研究基礎之上的提升研究;

8)現有基于計算機視覺的農業科技研究的高被引論文,只有部分有可能是因為抓住了研究熱點,從而被后續研究者因為“熱點”而參閱并引用。

需要說明的是,盡管本文所獲得的結論較為客觀、真實、可靠,但也依然存在一定缺陷,主要在于:本文采用的技術方法是文獻計量分析中的關鍵詞詞頻分析,這種技術因為擱置了對文獻內容和意義的分析,從而沒有揭示出可能存在于基于計算機視覺的農業科技研究中的內在發展邏輯、深層理論關系等。因此,本文所獲得的結論還有待于未擱置文獻內容和意義分析的綜述性文獻予以印證。

猜你喜歡
條數神經網絡計算機
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
神經網絡抑制無線通信干擾探究
巧算金魚條數
信息系統審計中計算機審計的應用
人民網、新華網、中國非公企業黨建網兩新黨建報道條數排行
對多邊形對角線條數的探究
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
每只小貓給了貓媽媽幾條魚
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合