?

大數據時代林業研究進展

2017-01-03 22:00董茜
合作經濟與科技 2017年1期
關鍵詞:研究進展大數據林業

董茜

[提要] 隨著大數據時代的來臨,數據的處理必將對林業的經營管理及研究產生重大而深遠的影響。本文在對大數據分析基礎上,分析國內外在大數據背景下的林業研究進展,分析目前國內林業相關大數據,并指出大數據分析在林業運用上的問題。

關鍵詞:大數據;林業;研究進展

中圖分類號:F32 文獻標識碼:A

原標題:試談大數據時代下的林業研究進展

收錄日期:2016年11月9日

以2013年8月“第三屆全國林業信息化工作會議”召開和《中國智慧林業發展指導意見》發布為標志,中國林業信息化由數字林業跨入智慧林業的新階段。智慧林業的實現,必將帶來林業生產力的又一次深刻變革,林業信息化也將迎來一個新的大數據時代。大數據具有數據量大、處理速度快、數據類型多、結構復雜、價值大、精度高的六大特征。近年來,隨著大數據時代的來臨,就如何合理運用大數據也將成為林業研究的熱門主題。

一、什么是大數據

大數據是由數據量巨大、結構復雜、類型眾多數據構成的數據基于云極端的數據處理與應用模式,通過數據的整合共享,交叉服用形成的智力資源和知識服務能力。通常要處理的數據量太大,增長太快,而業務需求和競爭壓力對數據處理的實時性、有效性又提出了更高要求,傳統的常規技術手段無法應付?;ヂ摼W數據中心(Internet Data Center)簡稱IDC定義了大數據的四大特征:海量的數據規模、快速的數據流轉和攻臺的數據體系、多樣的數據類型、巨大的數據價值。維克托·邁爾·舍恩伯格提出:“大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型?!?/p>

二、國內外林業研究進展

(一)國內研究進展。第七次全國森林資源清查暴露的問題令人警惕,清查五年間隔期內,林地轉為非林地的面積數字有所上升,形勢十分嚴峻,但這些逆轉的林地主要發生在哪些地區?數據大、復雜性是林業各個崗位上難以完成的嚴峻工作。但《全國林地保護利用規劃綱要(2010-2020年)》提出了大數據分析應用于林業生態統計,是林業有史以來可及時動態監測、及時決策的最全面、最細致、最先進的一項措施。大數據統計了全國林地,歸類成為了一張簡單的分布地圖,是高分辨率的遙感影像,全國林地落界數據、二類調查資料,基礎地理信息等多源數據集合,以林地界線為核心內容,構建的全國統一的林地資源管理系統。為國家林業局各業務司局提供數據支撐服務,將推進在森林經營、工程建設、森林防火等業務上的應用提供了便利。

以2013年8月“第三屆全國林業信息化工作會議”召開和《中國智慧林業發展指導意見》發布為標志,中國林業信息化由數字林業跨入智慧林業的新階段。

2014年郭建斌等在大數據深入分析的基礎上,指出了大數據時代林業科普信息化的現狀及不足,探索性地提出了林業科普信息化發展的對策與建議。郭建斌等認為面對大數據時代科普工作發展的趨勢,林業科普應以在全社會范圍內組織建設新型科技傳播與交流渠道為發展方向,建立基于信息技術不同形態的科技信息傳播與交流平臺,開發公眾滲透度高的科普渠道,加大民生科普、應急科普的傳播渠道建設力度,豐富大數據時代背景下的科普內容,加大科普信息輻射的強度和廣度,提高科普宣傳能力。

2015年6月藍學、韋緒、覃德文等基于大數據發展動態,大數據的性質和趨勢、林業部門的大數據應用三個方面,對大數據、云計算、物聯網等進行系統講解,深入分析當前信息化前沿技術的發展現狀與趨勢,結合生態林業民生林業的建設目標,闡述如何利用大數據為林業現代化服務。藍學等認為林業資源大數據分析的理論核心就是數據挖掘算法,各種林業資源數據挖掘的算法基于不同的物種數據類型和格式才能更加科學地呈現出數據本身具備的特點。也正是因為林業資源變更數據被全世界統計學家所公認的各種統計方法(可以稱之為真理)才能深入數據內部,才能體現大數據分析的便利。

(二)國外研究進展。近年來,由于生成大量的數據以及存儲數據的巨大增量,大數據的應用日益成為國外人們關注的焦點。美國聯邦政府、麥肯錫全球研究院和各大信息技術企業等紛紛發布有關大數據的倡議、計劃和報告,將大數據推到前所未有的高度。2012年2月《紐約》提出,“大數據”時代已經降臨,未來在商業及其他領域中,我們將基于數據和分析,而非經驗和直覺做出決策決策。

Del Río和Sara分析了幾種用于處理不平衡數據集的方法,在大數據的背景下,使用隨機森林分類的性能。通過采樣,采樣已經適應了使用Map Reduce,使這些技術的大數據能夠管理數據集,并且正確識別不同類別。進行了實驗研究,評估不同的算法的性能。

同時,國外在森林資源共享、大數據應用方面已經建立了比較完善的機制,共享的數據資源也非常豐富。數據共享對林業科技發展的作用已十分明顯。

三、我國林業相關大數據

大數據處理需要建立數據庫,就我國林業而言,需要的數據庫包括:林業檔案、林業年鑒、自然資源和地理空間數據庫、林業發展報告庫,等等。中國林業數字圖書館的建立,為中國林業大數據研究創建了條件。中國林業數字圖書館依托國家林業局內外網平臺建設,將為林業行業提供豐富的圖書、期刊、論文等信息資源。而中國國家衛星林業遙感數據應用平臺也為中國林業大數據的研究做出了貢獻。作為林業行業提供遙感基礎數據、數據處理平臺、數據產品發布平臺將大幅提高林業遙感應用水平。

四、大數據在林業上的應用

大數據在林業上的應用,目前主要的問題就是數據的提取,其理論核心為數據的挖掘。各種林業資源數據挖掘的算法基于不同的物種數據類型和格式才能更加科學地呈現出數據本身具備的特點,也正是因為林業資源變更數據被全世界統計學家所公認的各種統計方法才能深入數據內部,才能體現大數據分析的便利。第一部分是大數據林業內涵與重要意義,包括大數據林業內涵特征、產生背景、關系分析、關鍵技術、新觀念分析;第二部分是大數據林業總體發展思路,包括大數據林業戰略定位、基本思路、基本原則、建設目標、總體架構;第三部分是大數據林業的主要任務與重點工程,包括加快建設大數據林業立體感知體系、大力提升智大數據林業管理協同水平、有效構建大數據林業生態價值體系、全面完善大數據林業民生服務體系、大力構建大數據林業標準及綜合管理體系;第四部分是大數據林業推進策略,包括大數據林業推進路線圖、保障措施。要進行大數據的新題提取,必須具備單個方面的內容:(1)理論。理論是認知的必經途徑,也是被廣泛認同和傳播的基線。從大數據的特征定義理解林業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;從對大數據的現在和未來去洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。(2)技術。技術是大數據價值體現的手段和前進的基石。我將分別從云計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到形成結果的整個過程。(3)實踐。實踐是大數據的最終價值體現。我將分別從互聯網的大數據、政府的大數據、企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。

數據化是大數據的基礎。在生態林業資源動態變化中,數字化和數據化大相徑庭?!皵底只敝傅氖菍⑸鷳B林業資源變動中產生的信息、森林演替所產生的資源或環境變化的軌跡轉換成電子數據存入數據庫的過程;而“數據化”則是指在數字化的基礎上,利用數據來對森林變更進行描述,使之能同時被人和計算機所理解的結果。生態林業資源信息大量數據來自于不同來源、數量龐大的結構化與非結構化數據群,大部分都不能直接用于預測和分析。而通過對數據有效的組織,能將大量來自不同源的異構數據量化組合,形成森林資源數據化、森林類別數據化、生態資源使用量的數據化、森林屬性數據化等在信息化服務中管理者比較關心的數據化形式。數據化是將數據從無序到有序的加工階段,數據化的最終成果是將森林數據對象屬性量化,構建數據挖掘和服務的基本對象,簡化數據分析和利用過程。

五、大數據在林業運用上的特點

大數據分析要求林業工作人員在進行研究的過程中,改變思路,同時改變對數據來源的態度。相比之前的數據研究工作,大數據的主要特點是數據量大、數據種類繁多,這給林業工作人員帶來很多困擾,要求林業工作人員在繁雜的數據中,準確找到適合的可用數據。同時,在大數據分析時,主要研究數據之間的規律,從大量數據中找到能夠提取的信息,在提取過程中,經常會出現不精確數據,要求林業工作者及時擯棄數據或者在可接受范圍內允許少量的不精確數據出現。在多數情況下,數據來源于網絡。在大數據分析時,明確數據來源,分析數據的可靠性,就數據的相關性進行分析,而不是研究數據產生的原因。研究人員可以收集和分析大量相關數據的信息,找出可能有助于預測未來事件發生的規律。

中國林業大數據處理需要建立完整的數據庫整合和新建了林業政策法規庫、歷年統計數據庫、林業年鑒庫、林業發展報告庫、自然資源和地理空間庫、林業檔案庫等多個專題數據庫,內容豐富、查詢便捷,是信息化服務林業的又一重要成果。中國林業數字圖書館依托國家林業局內外網平臺建設,將為林業行業提供豐富的圖書、期刊、論文等信息資源,為林業職工和廣大公眾提供更好的服務。國家衛星林業遙感數據應用平臺作為林業行業提供遙感基礎數據、數據處理平臺、數據產品發布平臺將大幅提高林業遙感應用水平。林業綜合辦公系統群將把國家林業局機關和直屬單位納入統一的辦公平臺中,真正實現辦公一體化。

六、展望

在研究過程中,大數據作為一種資源也作為一種工具。他可以預測未來可能會發生的事情,但就對已經發生的事情沒有進行解釋,需要研究人員進一步分析。我們必須以一種不僅欣賞其力量,而且承認其局限的態度來接納這種技術。大數據在林業上的研究,就是林業在數字林業的基礎上,運用大數據、云計算、互聯網等信息技術,使林業實現智慧感知、智慧管理、智慧服務。通過大數據林業建設,形成信息基礎條件國際領先、生態管理與民生服務質量明顯提高、林業產業結構與創新能力優化發展的現代化模式。

主要參考文獻:

[1]李世東.大數據時代中國智慧林業門戶網站建設[J].電子政務,2014.3.

[2]覃德文,云朝光,秦武明等.PCR技術發展狀況研究[J].林業實用技術,2013.6.

[3]藍學,韋緒,覃德文.淺談大數據分析在生態林業上的運用[J].經濟研究導刊,2015.6.

[4]郭建斌,秦向華,萬志紅,李平.大數據時代林業科普信息化發展研究[J].經濟師,2014.9.

[5]張婷婷,趙睿濤.大數據對競爭情報研究的影響分析[J].競爭情報,2013.2.

[6]Del Río,Sara.On the use of Map Reduce for imbalanced big data using Random Forest.Information sciences,2014.285.

[7]維克托·邁爾·舍恩伯格.大數據時代:生活、工作與思維的大變革[M].浙江:浙江人民出版社,2013.

猜你喜歡
研究進展大數據林業
歡迎訂閱《林業科學研究》
MiRNA-145在消化系統惡性腫瘤中的研究進展
離子束拋光研究進展
land produces
獨腳金的研究進展
林業有害生物的防治
EGFR核轉位與DNA損傷修復研究進展
林業
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合