?

基于主成分分析、聚類分析的綠化樹種及其生理指標分類

2013-04-13 07:21
科技視界 2013年4期
關鍵詞:生理分析法樹種

楊 旸

(東南大學 機械工程學院,江蘇 南京 211189)

在環境保護、環境治理、城市規劃、園林設計、住宅綠地設計中,可供選擇的綠化樹種種類繁多,生理指標也較為復雜,但各生理指標具有一定的相關性,各不同樹種也具有一定的功能類別特性.在參考了大量論文及書籍后,本文應用主成分分析和聚類分析的方法對綠化樹種的生理指標和不同種類的樹種進行分類,以期為環保部門和城市建設提供新的思路.在相關領域,主成分分析法被用于小興安嶺低質林不同皆伐改造模式評價[9]、居民自愿供給城市森林生態服務研究[5],均有明顯的效果,將綠化樹種及其生理指標運用主成分分析法和聚類分析法,可以將各個生理指標歸納為相似相近的類別、將各個樹種同樣劃分類別,大大簡化了實際操作中樹種選擇的難度,有效增強了對周圍環境的針對性,也行有效減少樹種選擇失誤造成的經濟損失.

表1 綠化植物各項生理指標原始數據表

1 數據來源

本文所有的數據都收集引用自參考論文.參考論文中的數據經過統計并不能涵蓋每個樹種的每個生理指標,只取了其中較為有代表性的樹種,對于缺少的項目,取參考文獻中所有同類樹種(同為落葉喬木、常綠喬木或者為灌木)單項指標求平均值,同時也能降低其對整個數據分析的影響.各樹種的各項生理指標原始數據表1.表中只列出了常規的特征性指標,而一些較少的指標,對于分析研究沒有很大影響,便沒有在表中列出.已取得的平均值在表中已用括號做出了標記.

2 主成分分析法和聚類分析法(Principal Component Analysis, PCA;Cluster Analysis,CA)

主成分分析法也稱主分量分析或矩陣數據分析,通過變量變換的方法把相關的變量變為若干不相關的綜合指標變量.

若某研究對象有兩項指標 ζ1和 ζ2,從總體 ζ(ζ1,ζ2)中抽取了N個樣品,它們散布在橢圓平面內(見圖 1),指標 ζ1與 ζ2有相關性.η1和 η2分別是橢圓的長軸和短軸,η1⊥η2, 故 η1與 η2互不相關.其中 η1是點 ζ(ζ1,ζ2)在長軸上的投影坐標,η2是該點在短軸上的投影坐標.從圖1可以看出點的N個觀測值的波動大部分可以歸結為η1軸上投影點的波動,而η2軸上投影點的波動較小.若η1作為一個綜臺指標,則η1可較好地反映出N個觀測值的變化情況,η2的作用次要.綜合指標η1稱為主成分,找出主成分的工作稱為主成分分析.

圖1 主成分分析法示意圖

可見,主成分分析即選擇恰當的投影方向,將高維空間的點投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大[6].

給定一個對象集合 X={x1,x2,…,xn},假設每個對象 xi,i=1,2…,n含有m個特征,在此用向量的方式來表示對象的特征,xi=(l1,l2,…lm),聚類分析的過程就是根據對象的特征來分析對象之間的相似程度,并根據某種聚類決策準則來獲得聚類結果.聚類的結果用C={c1,c2,…,ck}表示,則聚類結果滿足以下條件:c1不為空集,i=1,2,…,k;ci∩cj不為空集,i≠j,j=1,2,…,k.模糊聚類的結果沒有上面的約束條件,模糊聚類給出的結果只是對象隸屬于每個類的程度.通常聚類分析算法一般包含四個部分:1)特征獲取與選擇;2)計算相似度;3)分組;4)聚類結果展示.

特征獲取與選擇就是為了獲得能夠恰當表示對象屬性的數據,并且減少數據的冗余度,在本文的前面一章中已經介紹了部分特征獲取與選擇的知識.計算相似度就是根據對象的特征來計算對象之間的相似程度,在聚類過程中可能一次性的計算所有對象之間的相似度信息,也可能在聚類分析的過程中按需要來計算對象之間的相似度信息,具體的過程要依據所采用的聚類方法而定,分組就是根據對象之間的相似程度來判斷對象之間的類別信息,將類似的對象分組到同一個類中,不相似的對象分組到不同的類中.聚類結果展示可以只是簡單的輸出對象分組信息,也可以用圖形化的方式來展示聚類結果,但是目前的研究趨勢要求算法能夠自動的歸納出每個不同的分組所代表的類信息并抽象出類中對象的共同特性[12].

3 主成分分析法和聚類分析法的應用

本文均利用SPSS軟件對所得數據進行分析處理,得到所要的主成分分析結果和聚類分析結果

3.1 主成分分析

3.1.1 原始數據的處理和標準化

根據主成分分析法的要求先對原始數據進行標準化處理,這里運用的是SPSS統計軟件進行的主成分分析,軟件在分析過程中會自動進行標準化處理,因此在這里不給出原始數據標準化結果.表2是SPPS軟件給出的經過標準化后對變量進行分析計算得出的相關性表.

表2 變量相關性表

3.1.2 綠化樹種生理指標主成分分析的計算結果

主成分分析的計算結果中,新變量所代表的方差(即對應的特征值)貢獻率和由原變量變換為新變量的線性變換系數(即對應的特征向量)就成為我們進行綜合分析的重點.在主成分分析中一般要求少數新變量的累積方差貢獻率應大于70%[9].下列表3、表4和表5分別給出了原始數據的公因子方差、各個主成分的解釋的總方差和主成分的計算結果.圖2則是各個主成分的特征值.

圖2 主成分特征值圖(碎石圖)

圖2表明,前三個主成分積累方差貢獻率達到90.76%,根據主成分分析法的一般原理,可取前三個具有明顯代表性的主成分.原有的8個變量可用三個主成分表示,如表5所示.再進過矩陣的旋轉,得到相關性更為明顯的三個主成分,如表6,其中相關的變量的相關性都達到了78%以上.

本文可以依據以上計算結果繪出成分圖,表明新舊變量之間的關系.同時,也可以為原始的綠化樹種生理指標分類再進過旋轉矩陣旋轉,得到成分圖,如圖3.

表3 原始數據公因子方差

表4 各成分解釋的總方差

表5 未旋轉的成分矩陣

表6 旋轉后的成分矩陣

3.1.3 結果分析

由主成分分析的計算結果可以看出,原變量的方差在新變量中的集中度很高,根據綠化樹種生理特性指標的實際狀況和主成分分析的要求,本文取前3個主成分來反映原來的8個變量,其方差的累計貢獻率已達到90.76%,三個主成分的貢獻率分別為47.85%,27.81%和15.10%,三個主成分在90.76%的程度上反應了樣本的生理特征.可以認為,這三個主成分基本上能夠反映出原變量的變化所代表的綠化樹種生理特性.

圖3 主成分組成成分示意圖

在第一主成分中,固碳量、釋氧量、日總釋水量、蒸騰吸熱量四個指數所占權系數較大,并且四個指標變化方向非常一致,呈幾乎完全正相關.說明引起這四個指標變化的原因相似,而處理的方式也相關.在植物的生命過程中,光合作用是必不可少的,是植物生存能量的來源,其中固碳量、釋氧量、釋水量都與光合作用直接相關,蒸騰吸熱量因為與釋水量有著很直接的關系,因此,蒸騰吸熱量與光合作用有著較高程度的間接關系,因此命名該成分為光合作用因子.

在第二主成分中葉片含硫量、含鉛量、干重滯塵量三個指數所占權系數較大,并且三個指標變化方向一致,呈正相關.說明三者的原因,處理相近.在植物日常生命過程中,通過葉片上的氣孔與外界進行氣體交換,而氣孔是分布在葉片表面的.而空氣中往往因為工業污染、交通尾氣污染存在大量粉塵、二氧化硫和重金屬鉛,在氣體交換的過程中,空氣中的灰塵、二氧化硫、少量的鉛會滯留在葉片表面或者被吸入葉片內部,因此,這三項指數都與氣體交換有著很直接的關系,因此明明該成分為氣體交換吸收因子.

圖4 組間連接樹狀圖

在第三主成分中,只有含鋅量一個指標,并且貢獻度遠大于其他指標.鋅是植物所需的微量元素,吸收原理與第二個成分不同,雖然鋅能夠從葉表吸收,但是,由于第二成分根據分析可知其為氣體交換因此,因而排除氣體交換成分,推斷其應為根系吸收成分,即綠化樹種對于鋅的吸收有別于上文中的第二因子,靠根系的吸收,因此命名為根系微量元素吸收因子.

3.2 聚類分析

3.2.1 原始數據處理

本文采用組間連接法利用SPSS軟件對綠化樹種的進行分類,表7是得到的組間連接法的平均連接表.

3.2.2 處理所得結果

將表中數據進行進一步處理可得樹狀圖,如圖4所示.

3.2.3 結果分析

比對原始數據表,可知總共18中綠化樹種,可分為三大類:碧桃、榆葉梅是一類,女貞是單獨一類,余下所有樹種共為一類;三大類中的第三大類又可分為兩類:白玉蘭、白蠟、銀杏、水杉、楊樹、連翹、大葉黃楊、小葉黃楊、杜仲、懸鈴木是一類,廣玉蘭、刺柏、香樟、元寶楓、國槐是一類;該兩類中第一類又可分為兩類:白玉蘭、白蠟和剩下的樹種.

4 結論

表7 聚類表

主成分分析法結果表明,綠化樹種的生理指標可以分為三類:光合作用成分,氣體交換吸收成分和根系微量元素吸收成分.每種成分中所包含的變量都是正相關的,故在環境保護與改善、城市規劃、住宅區綠化、園林設計選擇樹種選擇樹種或對綠化效果進行評價時,可以根據設計規劃要求的效果,只需從三個主要指標進行考慮,諸如:重點關注滯塵量或者鉛硫吸收量等,大大簡化了樹種選擇的難度和評價復雜性.

聚類分析結果表明,根據現有樹種實際功效可以將綠化樹種分類,以本文為例,在環境保護研究中,將所有各類綠化樹種進行分析,找出各個綠化樹種之間的相互替代性,進而在實際運用中,在同類要求的綠化標準下,選擇該類中成本最低的樹種,能夠大大降低綠化建設的成本,提高綠化效益,帶來巨大的經濟效益.

[1]李永杰.北京市常見綠化樹種生態效益研究[D].河北農業大學,2007.

[2]梁淑英.部分城市綠化樹種的生理特性及其對大氣污染的響應[D].南京林業大學,2008.

[3]韓煥金.城市綠化樹種生態功能研究[D].東北林業大學,2002.

[4]王海燕.呼和浩特市10種主要園林樹木生理生態特性與生態效益研究[D].內蒙古農業大學,2009.

[5]李英,裴佳音.基于聚類分析的居民自愿供給城市森林生態服務研究[J].福建:林業經濟問題,1005-9709(2008)03-0223-05.

[6]黃勝,王斌,丁桑嵐,陳秀眉,陳德川.主成分分析法在二灘水質監測數據綜合分析中的應用實例[J].重慶環境科學,2003,25(2):53-56.

[7]溫淑瑤,王京,丁根宏.應用主成分分析法評判湖泊營養類別[J].河海大學學報,1997,25(4):86-90.

[8]汪應洛.系統工程[M].北京:機械工業出版社,2009:54-60.

[9]呂海龍,董希斌.基于主成分分析的小興安嶺低質林不同皆伐改造模式評價[J].北京:林業科學,1001-7488(2011)12-0172-07.

[10]張莉.南京常見道路綠化樹種的環境效益研究[D].南京林業大學,2007.

[11]梁淑英.南京地區常見城市綠化樹種的生理生態特性及凈化大氣能力的研究[D].南京林業大學,2005.

[12]唐東明.聚類分析及其應用研究[D].電子科技大學,2010.

猜你喜歡
生理分析法樹種
異步機傳統分析法之困難及其克服
打破生理“平衡”
基于BP神經網絡的旋轉血泵生理控制
常綠樹種在新疆的應用現狀
基于時間重疊分析法的同車倒卡逃費探析
媽媽們產后的生理煩惱
層次分析法在SWOT分析法中的應用
城市綠化樹種選擇,只顧眼前你就輸了
一個樹種的國家戰略
“DIY式”小創新在神經電生理監測中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合