?

知識圖譜技術及其在農業領域應用研究進展

2023-11-26 10:12穆維松劉天琪苗子溦馮建英
農業工程學報 2023年16期
關鍵詞:農業知識本體圖譜

穆維松,劉天琪,苗子溦,馮建英

(中國農業大學信息與電氣工程學院,北京 100083)

0 引言

知識圖譜可以把復雜的知識領域通過數據挖掘、信息處理、知識計量和圖形繪制顯示出來,揭示知識領域的動態發展規律,為復雜問題的研究提供切實的、有價值的參考。知識圖譜的構建技術已經在各個領域得到廣泛應用并取得了較好的效果,如航空系統故障診斷[1]、地質災害應急決策[2]、網絡安全[3]等。隨著現代信息技術的不斷發展,知識圖譜的規模也在進一步擴大,在智能搜索、智能問答、推薦算法等領域都得到了廣泛應用[4]。在農業領域數據量積累越來越大、結構越來越復雜的大背景下,將知識圖譜技術與農業相結合,可以將農業領域復雜的數據直觀化,有助于對農業大數據進行深入的關聯分析,解決農業領域內數據分散、多樣、孤島化、數據價值利用不高的問題。知識圖譜把領域知識做了顯性化沉淀和關聯,利用原生圖的特征支撐數據的價值挖掘與分析。

知識圖譜構建關鍵技術是農業領域知識圖譜研究的基礎,農業知識圖譜構建既須遵循知識圖譜構建的通用技術,也須具有農業的特殊性。目前知識圖譜在農業領域的應用尚不廣泛,主要在農業專題文獻計量研究、農業知識問答等方面,可拓展的方向仍有待挖掘,因此本文首先對知識圖譜及其構建技術進行梳理,然后綜述知識圖譜在農業領域的應用方向,最后分析知識圖譜在農業領域的研究趨勢,以期為今后知識圖譜在農業領域的研究方向提供參考。

1 知識圖譜的構建模式

知識圖譜是一種含有豐富語義信息的網絡圖,早在2012 年,為使搜索引擎更加精準和智能,Google 公司提出了知識圖譜的概念及其含義,此后知識圖譜成為了一大研究熱點。知識圖譜的構建模式主要有自頂向下、自底向上和自頂向下與自底向上結合3 種[5]。

自頂向下的構建模式需要先創建頂層知識庫,然后從海量數據中抽取本體和實體信息,并將它們添加到最初創建的頂層知識庫中。

自底向上的構建模式需要先對數據進行知識抽取,然后再將得到的實體、關系和屬性經過實體對齊、語義融合、信息合并和知識加工等處理后,添加到知識圖譜中[6-7]。以這兩種模式構建知識圖譜的流程如圖1 所示。

圖1 知識圖譜的構建過程Fig.1 The construction process of knowledge graph

除了上述兩種常用的知識圖譜構建模式外,近年來有不少學者采用將二者結合的方式構建知識圖譜,這種構建模式需要先在大量數據中構建出最基本的模式層,然后通過不斷挖掘更有價值的知識更新模式層,最后設計模式層到數據層的映射,對實體進行填充,形成較為完整的知識圖譜[8-9]。

表1 從知識圖譜的構建模式、常用的應用領域、適用的數據量以及優缺點5 個方面歸納了知識圖譜3 種構建模式。

表1 知識圖譜構建模式的比較Table 1 Comparison of knowledge graph construction modes

2 農業知識圖譜構建的關鍵技術

農業知識圖譜的構建由于其領域的特殊性與較強的專業性常常采用自頂向下與自底向上結合的構建模式,其中涉及到的關鍵技術主要有本體構建、知識抽取、知識融合、知識推理和知識圖譜存儲及可視化,因此本文重點對這5 種技術進行綜述,旨在為農業知識圖譜的構建研究提供有效參考。

2.1 農業本體構建

農業知識圖譜對農業知識的專業度和精確度要求較高,需要在構建知識圖譜時構建抽象的模式層,因此本體的構建對于農業知識圖譜尤為重要[12]。本體的構建方法主要有兩種,分別是人工構建方法和使用計算機輔助的半自動構建方法,其中人工構建方法中典型的構建方法主要有Uschold 法、多倫多虛擬企業本體評價法(toronto virtual enterprise,TOVE)、集成化計算機輔助制造定義方法(integrated computer-aided manufacturing definition,IDEF)、Methontology 法,半自動構建方法中典型的構建方法主要有七步法、五步循環法和循環獲取法[13]。

人工構建方法由于其構建過程存在很大的主觀性,本體之間容易出現概念偏差,不完全適用于知識結構復雜的農業領域,因此在進行農業本體構建時,半自動構建方法受到了許多研究者的關注[14]。以常用的七步法為例,構建領域本體時需要經過確定領域和范圍、復用現有本體、列舉專業術語、定義類和類層次結構、定義屬性、定義約束、創建實例7 個步驟,清晰地規范了本體的構建流程。該方法在構建花卉病蟲害[15]、茶葉[16]、農村金融[17]等農業領域本體時發揮了較好的作用。此外,農業本體構建技術的發展離不開強大的構建工具,Protégé軟件[18]和OWL(ontology web language)本體描述語言[19]在農業領域最受歡迎。

2.2 農業知識抽取

知識抽取指的是從大量的數據中提取有用的知識并存儲到知識圖譜中,是構建知識圖譜的前提。知識抽取的對象主要有結構化數據、半結構化數據和非結構化數據3 種,目前研究的重點是針對結構化數據和半結構化數據進行知識抽取[20]。知識抽取主要分為實體抽取、關系抽取和屬性抽取3 個方面,早期知識抽取技術發展不成熟,人們主要采用人工編寫的規則將農業實體存儲到數據庫中來實現農業知識的抽取,但這樣基于規則的抽取方法對于本體關系復雜、知識結構不統一且數據種類龐大的農業知識來說效率低下,而且要求規則的制定人員具備較高的語言學知識水平。

針對上述問題,許多學者在進行農業知識抽取時融入了機器學習和深度學習模型,它們比基于規則的知識抽取方法表現出更好的性能?;跈C器學習的知識抽取最早在2008 年應用到農業中,作者使用決策樹學習并建立一套有效規則,實時抽取農田的作物、氣候等信息,用于預測植物的狀態[21]。但這種使用機器學習模型建立的規則仍需人工決策,于是研究者們把目光轉向文本本身的機器學習模型,如最大熵模型[22](max entropy model,MEM)、隱馬爾可夫模型[23](hidden Markov model,HMM)、支持向量機[24](support vector machine,SVM)和條件隨機場模型[25](conditional random field,CRF)。目前應用最為廣泛的是綜合了MEM 和HMM 優點的CRF 模型[26]。但是只使用單一的機器學習模型進行知識抽取時需要研究者根據不同的領域為數據設計不同的特征,模型的性能并不理想,因此不少學者開始將深度學習與上述模型進行結合。

BiLSTM(bidirectional long short-term memory)結合了向前和向后的LSTM,能夠充分利用句子的上下文特征,提高標注的準確性,因此許多研究人員將其與CRF 模型進行結合,并在農業知識抽取領域取得了不錯的成果。張海瑜等[27]使用BiLSTM-CRF 模型進行了糧食作物知識的抽取,解決了農業知識表達不規范和一物多詞與多解的問題;于合龍等[28]使用BiLSTM-CRF 模型進行了水稻病蟲害知識的抽取,解決了水稻病蟲害知識檢索的不確定性。由此可見,BiLSTM-CRF 模型較適用于結構復雜且命名難統一的農業知識提取任務;為解決知識抽取過程中長序列的語義稀釋問題,程名等[29]在BiLSTM-CRF 模型的基礎上融合了注意力機制,提高了漁業標準知識抽取的性能。

BiLSTM-CRF 模型對詞嵌入的依賴較小,但無法表示多義詞,因此部分學者開始在此基礎上引入BERT(bidirectional encoder representations from transformers)模型。該模型能夠將字符和句子進行預訓練得到字向量,不僅包含了上下文信息,還能夠很好地表征字句的含義,可以較好地解決農業文本中的一詞多義問題,隨后BERT-BiLSTM-CRF 模型成為了農業知識抽取領域的熱門方向[30]。使用BERT-BiLSTM-CRF 模型進行農業知識抽取的流程是:首先通過BERT 獲得輸入語句的語義表示,生成字向量,然后通過BiLSTM 對字向量進行進一步的語義編碼,最后通過CRF 輸出最大概率標簽序列。該模型于2020 年由吳賽賽等[31]用于作物病蟲害知識抽??;任媛等[32]在該模型的基礎上融合了注意力機制,實現了漁業標準定量指標知識抽取。目前,學者們將農業知識抽取的重點放在了如何更好地結合農業知識的特點上,韋紫君等[33]為解決農業實體名稱較長導致的識別效果不理想的問題,在BERT-BiLSTM-CRF 模型的基礎上引入實體級遮蔽策略,提高了農業知識抽取的性能;劉永波等[34]為解決茶葉語料庫不完善、多源異構數據缺乏聚合能力的問題,使用全詞掩碼的BERT-WWM(whole word masking)替代原來的隨機掩碼BERT,提高了茶葉知識抽取的準確率;劉巨升等[35]提出的BERTCaBiLSTM 模型解決了水產動物疾病診治實體嵌套問題,提高了知識抽取的質量。知識抽取技術在農業領域的發展如圖2 所示。

圖2 知識抽取技術在農業領域的發展Fig.2 Development of knowledge extraction technology in agriculture

2.3 農業知識融合

知識融合建立在知識抽取的基礎之上,指的是將不同來源、異構的數據在統一框架下進行整合,使其能夠互相連通,目的是提高知識圖譜的質量。由于領域的特殊性,農業知識的來源較為復雜且命名較難統一,因此存在質量參差不齊、一物多詞等問題,所以對農業知識進行有機整合,判斷實體的重復性是農業知識融合中的重難點。知識融合的關鍵技術主要有實體對齊、語義融合和信息合并3 個方面,其中實體對齊技術在農業領域的應用最廣。

在農業知識融合過程中,為消除農業實體名稱不一致或數據類型不同造成的沖突,早期研究者們通常會選擇基于傳統概率模型的對齊方法,即計算向量相似度的方法進行實體對齊研究。曹雨晴等[36]首先對不同來源的知識進行人工合并,然后再結合相似度對水稻粒型基因進行了實體對齊;陳瑞[37]使用索俊鋒等[38]提出的農產品語義相似度計算方法對不同來源的網絡農產品進行實體對齊。

雖然基于傳統概率模型的實體對齊方法在農業知識融合中較為常見,但這類方法需要預先對大量的數據進行標記,處理大型數據時性能低下。有學者指出,實體對的匹配問題也可以轉換為分類問題[39],因此在理論上機器學習和深度學習方法可以提高農業知識融合的效率。隨后在其他領域,使用決策樹、樸素貝葉斯、支持向量機等進行實體對齊研究的學者越來越多且取得了不錯的成果[40-43]。目前使用深度學習方法中的詞向量進行農業知識融合是最新的研究趨勢。MOSHOU 等[44]提出一種融合詞向量與語義余弦相似度的多模態農業實體對齊方法,可以將不同數據源中的實體對齊;QIN 等[45]提出一種融合TF-IDF 和余弦相似度的農業實體對齊方法,提升了農業知識檢索的效率;鄭泳智等[46]使用BERT 得到詞向量并計算它們之間的余弦相似度,對荔枝和龍眼病蟲害實體進行了對齊。但基于機器學習和深度學習的實體對齊方法往往忽略了實體之間隱含的語義特征,有時效果并不十分理想,因此不斷有學者開始提出基于新技術的實體對齊方法。

知識表示學習可以將知識圖譜中的實體進行低維的向量表示,然后把不同知識圖譜的嵌入空間映射到同一個向量空間中,最后通過計算向量空間中實體間的距離進行實體對齊,相關技術主要有翻譯模型[47]、圖卷積網絡[48]、圖注意力網絡[49]等。目前基于知識表示學習的實體對齊技術在農業領域的應用較少,因此未來農業知識融合相關的研究需要密切關注最前沿的新技術和新方法。

2.4 農業知識推理

知識推理指的是在已經抽取的實體和關系中去發現新的知識,從而豐富和擴充知識圖譜。知識推理包括基于規則的知識推理、基于分布式表示特征的知識推理和基于深度學習的知識推理,起初基于規則的知識推理在農業領域中應用較為廣泛,于2016 年由牟向偉等[50]應用到農業領域中,作者提出的基于描述邏輯的CC-HACCP模型,實現了農產品冷鏈知識推理;黃利斌[51]使用領域詞匯的統計特征量化了農業詞匯的相關性,并結合互信息法完成了農業語義推理;LIU 等[52]根據專家經驗制定了番茄病害診斷規則庫,并結合正向表示和推理模型完成了番茄病害的診斷。盡管基于規則的知識推理在農業領域中已有應用,但仍存在推理結果可解釋性弱的問題,為了改進這一點,于合龍等[28]開創性地將專家置信度確定性因子CF 融合到農業知識推理中,提高了水稻病蟲害診斷的確定性。

雖然知識推理技術在農業領域的應用已有一定的成效,但不可否認的是,對農業產生影響的因素較為復雜,在制定推理規則時困難較大,必要時需要考慮自然環境變化與氣候對農作物的影響,若溫度、光照或濕度稍有變化都可能導致推理結果出現較大的偏差,因此基于規則的知識推理只能在小范圍內使用,難以進行擴展。相較之下基于分布式表示特征的知識推理和基于深度學習的知識推理更具優勢,未來有望在農業知識推理這一構建環節得到廣泛應用[53]。

基于分布式表示特征的知識推理主要包括翻譯模型和語義匹配模型兩個方面?;诜g模型的知識推理使用基于距離的評分方法,在稀疏知識圖譜上的推理結果表現較好,但這類模型往往容易忽略多跳知識,語義解釋性較弱[54],最具代表性的就是基于Trans 系列的TransE[55]、TransH[56]、TransR[57]和TransD[58]模型,它們在原理上依次遞進。目前,基于翻譯模型的知識推理在農業領域的應用剛剛起步,于2021 年GUAN 等[59]將這一技術引入農業領域,作者使用TransR 對果樹病蟲害文本進行編碼,提高了預測蘋果樹病蟲害的準確率?;谡Z義匹配模型的知識推理使用基于相似度的評分方法,該方法通過匹配實體的潛在語義和向量空間表示中體現的關系來判斷事實的合理性,語義解釋性與翻譯模型相比較強,但模型的復雜度較高[60],代表性模型有RESCAL[61]、DistMult[62]和HolE[63]等。

基于深度學習的知識推理可以自動獲取特征,并將數據特征從原始空間映射到特征空間,進而實現知識推理,這種方法對特征較為敏感,能夠很好地進行特征捕捉[64],常用的技術主要有圖卷積模型[65]、循環神經網絡[66](recurrent neural network,RNN)、卷積神經網絡[67](convolutional neural network,CNN)、Transformer[68]等。

2.5 農業知識圖譜存儲及可視化

知識圖譜只是對實體和關系進行了最基本的描述和存儲,若要觀察知識圖譜中實體間的關系和變化規律則需要對知識圖譜進行存儲并可視化,幫助用戶從不同的角度分析數據[69]。目前主流的可視化工具主要有Neo4j[70]、D3.js[71]、Gephi[72]、Echarts[73]、Cytoscape[74]、CiteSpace[75]等,其中CiteSpace 常用于農業專題文獻計量研究,Neo4j在農業知識問答、農業資源推薦以及農業信息檢索等方面的應用較多。

2.6 農業知識圖譜構建關鍵技術比較

通過對農業知識圖譜構建技術的梳理可以發現,本體構建和知識抽取在農業領域的研究較多且技術先進,而農業知識融合與農業知識推理環節的技術研究沒有得到足夠的重視,導致這兩方面的技術發展缺乏創新性。隨著農業知識量的增長,農業知識圖譜也在不斷膨脹,未來農業數據會更加復雜,如何發展農業知識圖譜的構建技術以提升構建效率將會是該領域的一大挑戰。本文將農業知識圖譜構建過程中使用的關鍵技術及其未來的可發展方向總結如表2 所示。

表2 農業知識圖譜構建關鍵技術及其發展難點Table 2 Key technologies and development difficulties of agricultural knowledge graph

3 知識圖譜在農業領域的應用

知識圖譜在電商產品推薦、圖書情報和搜索引擎等領域得到了廣泛應用,但在農業領域的研究相對滯后,現有研究主要集中于農業專題文獻計量研究、農業信息檢索、農業知識問答和農業信息資源推薦4 個方面,如圖3 所示。

圖3 知識圖譜在農業領域的應用Fig.3 Application of knowledge graph in agriculture

3.1 農業專題文獻計量研究

在知識圖譜最初興起之時,學者們專注于將知識圖譜作為分析農業專題文獻的工具,用它來發現農業領域的研究主題和技術熱點,便于為農業發展方向的實踐和探索提供參考和指導意見。周麗霞[81]用CiteSpace 對CSSCI 數據庫中與農業規模經營領域的發展歷史相關的文獻進行了分析并發現,適度規模經營有助于農業持續發展,誰來經營、經營多少以及如何實現是農業規模經營領域的三大要點。林偉君等[82]使用CiteSpace 對中國知網數據庫中與智慧農業相關的文獻進行分析,發現我國智慧農業的前沿研究熱點是無線傳感器網絡、互聯網+以及物聯網等,這些技術已經應用到病蟲害防控、農業遙感等領域。SONG 等[83]使用CiteSpace 對Web of Science數據庫中與農業電子商務研究現狀相關的文獻進行了分析,認為農業電子商務的模式和用戶滿意度在農業電子商務未來的研究中需要重視。在農業專題文獻計量分析中,CiteSpace 常被用來實現學科領域的共現分析,梳理領域發展態勢。

3.2 農業信息檢索

隨著知識圖譜構建技術的不斷進步,以信息搜索為主的普惠型信息服務開始逐漸面向農業經營主體,包括農業信息檢索、農業知識問答、農業信息資源推薦等。使用知識圖譜構建的農業領域信息檢索系統可以將農業知識規范化,避免知識零散和歧義帶來的問題。早期的農業信息檢索研究嚴重依賴于人工數據標注,現在則多采用深度學習方法識別農業實體,如張海瑜等[27]提出一種基于語義知識圖譜的農業知識智能檢索方法,首先人工構建農業本體,然后使用BiLSTM-CRF 模型抽取農作物別名,最后使用Neo4j 進行知識存儲,實現了農業知識的規范分類,解決了農業知識一物多詞的問題;于婷婷[84]為實現農作物信息的存儲檢索設計了農作物知識圖譜,作者首先實現了從農業科學敘詞表到農作物本體的轉換,然后使用BERT-BiLSTM-CRF 模型進行農作物知識抽取,最后用Neo4j 進行知識存儲;沈利言[85]為提高水稻栽培技術的傳播效率構建了水稻栽培方案知識圖譜,作者首先參考多種數據來源人工構建了草莓知識本體,然后融合注意力機制和BiLSTM 模型進行知識抽取,最后用Neo4j 圖數據庫存儲水稻知識圖譜并實現了可視化水稻栽培方案檢索。

3.3 農業知識問答

使用知識圖譜技術構建面向具體農業任務的問答系統有助于幫助農戶快速、精準地解決某些領域內的專業問題。最初農業知識問答系統通過計算實體相似度實現,需要匹配大量的農業知識問答庫,效率較低?,F在隨著知識融合與知識推理技術在農業中的不斷發展,農業知識問答系統具有了一定的擴展能力。李巖[86]首先使用Protégé工具構建了禽畜疾病防治本體,然后使用基于規則的知識抽取方法從網頁中人工抽取知識并使用Neo4j對知識進行存儲,最后設計并實現了禽畜疾病領域問答系統使用,為禽畜疾病的重要技術提供了支撐;周子豪[87]提出了一種實體關系聯合抽取模型BERT-LCM-Tea 用于進行茶葉知識抽取,解決了茶葉實體間關系重疊問題,然后作者又提出了CBOW-TransE 模型用于茶葉知識融合,最后使用Neo4j 存儲茶葉知識,實現了茶葉知識問答系統,該系統能夠幫助茶農梳理茶葉種植和培育的專業知識,為制茶企業提供輔助決策。王宇航等[76]將文本轉換為字符和詞對的序列,在此基礎上改進了BERTBiLSTM-CRF 模型并進行農業知識抽取,然后用Neo4j存儲,實現了農業自動問答系統,該系統能夠高效高質量地整合農業知識應用。在農業知識問答中,知識抽取作為構建知識圖譜必不可少的步驟在該應用領域最為常用,Neo4j 圖數據庫由于其查詢高效的優勢常被用作存儲知識。

3.4 農業信息資源推薦

基于知識圖譜進行農業領域的信息資源推薦可以有效篩選冗余信息,為用戶快速推薦符合其個性化需求的產品。最初的農業信息資源推薦以分析語義為主,如郭偉光[69]針對用戶難以快速找到其偏好農產品的問題設計了農產品推薦系統,作者首先使用Protégé工具構建了農產品本體,然后經過語義查詢和分析為用戶推薦其感興趣的農產品。后來隨著基于知識圖譜的個性化推薦算法的發展,學者們開始根據用戶的個性化需求、偏好和個人特征為其進行推薦,如孫琳[88]針對農戶搜尋有效信息效率底下的問題設計了基于知識圖譜的農業在線信息資源推薦系統,使用融合注意力機制的BiLSTM 模型抽取非結構化農業知識,并將用戶對知識圖譜中實體的偏好程度融合到推薦算法中,實現農業信息的個性化推薦;戈為溪等[89]首先使用PairRE 模型獲取實體和關系的向量表示,然后通過知識推理得到具體的施肥方案,最后根據相似的方案為農戶推薦精確的施肥量。

3.5 知識圖譜在農業領域應用的比較

知識圖譜在農業領域應用的比較如表3 所示,可以看出,本體構建、知識抽取和知識圖譜存儲及可視化技術最為常用,但知識融合、知識推理在農業應用領域使用較少,這表明農業知識圖譜在構建過程中不夠規范、完整,因此農業知識圖譜應結合農業知識特點重點關注構建技術的發展與創新。

表3 知識圖譜在農業領域應用的比較Table 3 Comparison of knowledge graph applications in agriculture

4 結論與展望

4.1 結論

本文通過梳理知識圖譜技術在農業領域的應用研究進展,總結了知識圖譜的構建模式、農業知識圖譜構建的核心技術的發展過程、現狀和局限性,并綜述了當前知識圖譜在農業領域的應用場景。主要結論如下:

1)在農業知識圖譜的構建技術中,知識抽取技術已經發展較為成熟,以BERT-BiLSTM-CRF 為代表的模型得到了廣泛應用,然而知識融合與知識推理在農業知識圖譜的構建過程中缺乏重視,使用的方法較為落后。隨著農業知識數據量的增長,未來的農業數據會更加復雜,為了提升農業知識圖譜構建的效率,在農業知識融合階段可以參考知識表示學習方法,豐富農業實體之間隱含的語義特征;在農業知識推理階段可以參考基于分布式表示特征的方法和基于深度學習的方法,挖掘隱藏的農業實體間的關系。

2)目前知識圖譜在農業領域的應用場景主要集中于農業專題文獻計量研究、農業知識問答、農業信息資源推薦和農業信息檢索等方面,但知識圖譜在這些場景中的應用仍存在一些不足,表現為:農業專題文獻計量研究的范圍較窄,無法從多個數據源同時獲取信息;農業信息檢索的效果不夠理想,對于農業工作人員來說使用的便利度不夠;農業知識問答無法對復雜問題進行實際推理,難以滿足實際需要;農業信息資源推薦使用的算法較為落后,推薦精度較低。這些實際應用上的缺陷仍需改進,知識圖譜技術在農業領域的應用還有很大發展空間。

4.2 展望

知識圖譜中包含的信息形式多樣且多源異構,含有豐富的語義關系,將知識圖譜相關技術應用于農業領域,有助于更深入地挖掘和表示農業領域的知識關聯和規律。結合知識圖譜技術的發展趨勢、目前知識圖譜農業應用的不足和未來農業發展對知識圖譜技術的要求,本文認為未來應關注以下幾方面的研究。

1)基于知識圖譜的農產品電商推薦

目前,推薦算法已經在各類電商平臺廣泛應用,但這些推薦算法大多基于用戶的瀏覽、購買等歷史記錄進行相似性推薦,面臨用戶-物品評分矩陣稀疏性和冷啟動等問題,導致推薦結果不準確,為解決上述問題,研究者們嘗試將知識圖譜作為輔助信息融入到傳統推薦算法中從而提升算法的性能,知識圖譜可以在不受用戶-物品評分矩陣稀疏性影響的同時,為傳統推薦算法的結果提供可解釋性。

但當考慮將基于知識圖譜的推薦算法應用于農產品電商推薦時,難度仍然較大。目前針對農產品知識圖譜的研究較為匱乏,農產品的品種較為多樣且特征區分度不夠明顯,許多新品種對于多數消費者來說更是聞所未聞,直接將推薦算法用于農產品推薦難以滿足農業工作者的需求。電商農產品知識圖譜構建中的實體和關系抽取都需要考慮農產品的特殊性,電商農產品推薦算法的精準性也會是研究的難點。

2)動態農業知識圖譜的構建

知識圖譜中的實體和關系在現實世界中具有時效性,構建動態的知識圖譜有利于根據真實環境的變化實時更新知識挖掘的結果,實現更為精準的推薦或檢索。動態農業知識圖譜可以為農戶提供最新的技術和相關信息,有助于農戶和農業相關技術人員對農業任務進行及時調整。但是構建動態農業知識圖譜的過程中必須考慮到農業實體的特殊性,在這類知識圖譜中不僅知識是變化的,甚至節點的數量也會根據實際情況(如農作物不同生長期等)有所變化,因此時序動態知識表示學習相關算法如何去適應農業實體特點將會是構建動態農業知識圖譜的一大挑戰。

3)跨領域知識圖譜的構建與關聯

目前知識圖譜在構建過程中往往抽取的是同一領域中的實體信息,如何實現跨領域、跨來源的實體抽取成為了一大難題。構建農業范圍內的跨領域知識圖譜可以將育種、種植、澆灌、病蟲害防治、物流、銷售等過程融合在一起,避免單一領域知識圖譜的局限性,考慮不同流程之間的影響和相互關系,實現多維度的推薦和檢索任務,提供更全面的推薦和檢索結果。但是目前跨領域知識圖譜的研究尚未成熟,如何應用到農業領域也是將來一個較大的挑戰。

猜你喜歡
農業知識本體圖譜
Abstracts and Key Words
繪一張成長圖譜
新媒體在農業知識科普宣傳中的應用探究
論廣播記者如何做好“三農”新聞報道
補腎強身片UPLC指紋圖譜
苗木繁育技能訓練通識教育課程探索與實踐
主動對接你思維的知識圖譜
《我應該感到自豪才對》的本體性教學內容及啟示
農業知識云服務設計與實現
專題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合