?

二氧化硫濃度與顏色讀數的多元線性回歸模型

2020-11-02 09:33殷冬琴
甘肅科技縱橫 2020年8期
關鍵詞:線性回歸二氧化硫

殷冬琴

摘要:本論述根據實驗提供的25組有關二氧化硫濃度與顏色讀數的數據,利用EXCEL數據分析工具,建立了二氧化硫濃度與顏色讀數GBRSH之間的五元線性回歸模型,結果顯示該模型擬合程度較好,但是t統計值和P值顯示顏色分量RSB對二氧化硫濃度的影響不顯著。隨后計算顏色分量之間的相關系數,結果顯示顏色分量之間存在多重共線性。為此,對建立的五元線性回歸模型采用逐步回歸法進行優化,統計結果顯示出在給定的5個顏色分量GBRSH中,對二氧化硫濃度的影響由主到次的順序依次為:G>H>B>S>R,可見影響二氧化硫濃度的主要顏色分量為G和H。

關鍵詞:顏色讀數;二氧化硫;線性回歸;逐步回歸

中圖分類號:G642.0 文獻標志碼:A

1概述

隨著照相技術和顏色分辨率的提高,人們希望建立物質濃度和顏色讀數之間的數量關系?!段镔|濃度與顏色讀數的回歸分析》一文根據實驗數據,利用向后變量易0除法,建立了組胺、溴酸鉀、奶中尿素三種物質的濃度與顏色讀數之間的多元線性回歸模型。但根據實驗數據,用類似的方法討論二氧化硫濃度與顏色讀數之間的多元回歸模型時,效果不理想。本論述利用逐步回歸法,建立了二氧化硫濃度與顏色讀數之間的多元線性回歸模型,并且在顯著性水平a=0.05下,通過相關系數R2、F檢驗、t檢驗對該模型進行了評估,得出在顏色分量RGBsH讀數中對二氧化硫濃度影響由主到次的順序為:G>H>B>s>R,其中紅(R)、綠(G)、藍(B)是顏色的三基色,亮度(B)、飽和度(S)、色調(H)是顏色的三要素,文中實驗數據B是指三基色中的藍色。

2多元線性回歸分析

2.1模型建立

首先整理實驗數據,見表1所列。利用ExCEL數據分析工具對表1數據進行回歸分析,得到二氧化硫濃度與各顏色分量的五元線性回歸結果見表2所列。

從而五元回歸方程為:

y=2846.29122+0.64717R-19.92775G+5.27286B-4.89616S-10.35390H (1)

由表2看出,相關系數0.89957,說明方程(1)擬合程度較好,但是t統計值和P值顯示顏色分量R、s、B對二氧化硫濃度的影響不顯著,造成這一現象的原因可能是數據量或錯誤,也可能是各顏色分量之間存在多重共線性。下面計算各顏色分量之間的相關系數,結果見表3所列。

表3顯示顏色分量R、G之間,R、B之間,R、H之間,G、B之間,G、H之間,B、H之間相關程度都很高,表明確實各顏色分量存在多重共線性。

2.2模型優化

針對上述模型中的多重共線性問題,運用逐步回歸的方法對模型進行優化。逐步回歸的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經選人的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。先利用EXCEL數據分析工具,建立二氧化硫濃度分別與各顏色分量RGBSH的一元回歸模型,見表4一表8所列。

對于一元線性回歸,t值、P值與相關系數檢驗是等價的,故比較表4-表8的相關系數,可知二氧化硫濃度與顏色分量G擬合最佳,說明RGB三基色中G對二氧化硫濃度的反應最顯著,其回歸方程為:

y=295.6374-2.15228G (2)

下面以二氧化硫濃度y與顏色分量G的一元回歸為基礎,依次加入其他顏色分量,進行二元回歸分析,具體結果見表9-表12所列。

比較表9一表12的相關系數,F值和t值可知二氧化硫濃度與顏色分量GH的二元回歸效果最佳,說明顏色要素SH中的H對二氧化硫濃度的反應最顯著。其二元回歸方程為:

y=1802.638-11.735G-5.04823H(3)

表12顯示相關系數為0.88285,說明模型擬合度較好,但是多元回歸還要通過F檢驗和t檢驗。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-l=2和n-k=22的臨界值F0.05(2,22)=3.443,模型求得F=82.90042>F0.05(2,22),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=22的臨界值為t0.05(22)=1.7171,型求得各顏色分量G、H對應的t統計值分別為:6.03992、-4.95371,絕對值均大于t0.05(22)=1.7171,通過t檢驗。

以二氧化硫濃度y與顏色分量GH的二元回歸為基礎,依次加入其他顏色分量,進行三元回歸分析,具體結果見表13-表15所列。

比較表13-表15的相關系數,F值和t值可知二氧化硫濃度與顏色分量GHB的三元回歸效果最佳,其三元回歸方程為:

y=1867.406-17.2342G+5.155534B-8.91935H(4)

表14顯示相關系數為0.89576,說明模型擬合度較好,下面進行F檢驗和t檢驗。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-1=3和n-k=21的臨界值F0.05(3,21)=3.072,模型求得F=60.15237>F0.05(3,21),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=21的臨界值為t0.05(21)=1.7207,模型求得各顏色分量G、B、H對應的t統計值分別為:-4.42757,1.61238,-3.43757,其中G、H的均t計值絕對值均大于to.05(21)=1.7207,通過t檢驗,但B的t系計值小于t0.05(21)=1.7207說明回歸方程(4)中顏色分量B對二氧化硫濃度影響不顯著。

以二氧化硫濃度與顏色分量GHB的三元回歸為基礎,依次加入其他顏色分量,進行四元回歸分析,具體結果見表16-表17。

比較表16-表17的相關系數,F值和t值可知二氧化硫濃度與顏色分量GBSH的四元回歸效果佳,其四元回歸方程為:

y=2864.877-19.8835G+5.496888B-4.60243S-10.4529H(5)

表17顯示相關系數為0.8995,說明模型擬合度較好。F檢驗:在給定顯著性水平a=0.05下,查表可得自由度為k-1=4和n-k=20的臨界值F0.05(4,20)=2.886,模型求得F=44.7526>F0.05(4,20),說明方程整體顯著,通過F檢驗;t檢驗:在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=20的臨界值為t0.05(201=1.7247,模型求得各顏色分量G、B、S、H對應的t統計值分別為:-3.99595,1.695899,-0.86311,-3.31012,其中G、H的t統計值絕對值均大于to.05(20)=1.7247,通過t檢驗,但B、s的t統計值小于t0.05(20)=1.7247,說明回歸方程④中顏色分量B、s對二氧化硫濃度影響不顯著。

綜上,得到以下結論:

第一,二氧化硫濃度y與顏色分量的最優回歸模型是回歸方程(3),即

y=1802.638-11.735G-5.04823H

第二,顏色分量RGBSH中對二氧化硫濃度影響由主到次的順序依次為:G>H>B>S>R。

第三,顏色分量三基色RGB中,綠色GXCZ.氧化硫濃度影響最顯著,藍色B次之,紅色R最弱。顏色要素SH中,色調H對二氧化硫濃度影響最顯著,飽和度S次之。

3模型不足

本論述中得到的最優線性回歸模型顯示二氧化硫的濃度僅與兩個顏色分量GH的讀數關系顯著,與其他三個顏色分量RBS關系不顯著,造成這一結果的原因可能是提供的實驗數據量不足或有錯誤數據,也可能是實驗數據更適合非線性回歸的討論,后續將進一步探討。

猜你喜歡
線性回歸二氧化硫
二氧化碳和二氧化硫對碘離子被空氣氧化的影響
葡萄酒為什么要加二氧化硫
添加了二氧化硫的食品能吃嗎
“二氧化硫與二氧化碳”知識歸納
國道公路養護管理與規劃研究
投資者情緒與股票市場收益的相互影響分析
企業退休金收支平衡的研究
企業退休金收支平衡的模型分析
中國服務業競爭力因素分析
葡萄酒中為什么會有二氧化硫?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合