?

Excel在動物科學試驗中的應用

2017-03-06 13:48李金輝
現代農業科技 2017年1期
關鍵詞:方差分析

李金輝

摘要 本文介紹了Excel軟件的數據處理功能在動物科學專業科研生產中的具體應用實例及操作方法,包括雙樣本顯著性檢驗(t檢驗)、多樣本顯著性檢驗(方差分析)、雙變量線性回歸和相關分析。

關鍵詞 Excel;生物統計;顯著性檢驗;方差分析;線性回歸與相關分析

中圖分類號 G642.423 文獻標識碼 A 文章編號 1007-5739(2017)01-0283-04

Application of Excel in Animal Science Experiment

LI Jin-hui

(College of Animal Science and Veterinary Medicine,Henan Institute of Science and Technology,Xinxiang Henan 453000)

Abstract This paper introduced the data processing function and the operation method of Excel software on research of Animal Science,included two samples test of significance (t-test),multiple samples test of significance (analysis of variance) and analysis of two variables linear regression and correlation.

Key words Excel;biological statistics;test of significance;analysis of variance;linear regression and correlation analysis

生物統計學是動物科學和動物醫學專業的專業基礎課,是數理統計在生物學中的應用,它不僅提供如何正確地設計科學試驗和收集數據的方法,而且也提供如何正確地整理、分析數據,得出客觀、科學結論的方法[1]。它是運用概率論和數理統計的原理和方法,來分析和解釋生物界各種現象和實驗調查資料的一門科學。不僅在傳統生物學、醫學、藥學和農學中被廣泛應用,而且也是新興的現代分子生物學研究中不可缺少的工具。在農林類院校,生物統計學是一門應用性極強的專業基礎課,是學生分析、解釋生產實踐中具有不確定性現象的工具。通過系統教學,培養學生的邏輯思維能力,使學生了解該課程的基本原理,掌握基本概念和方法,并能初步運用數學的方法來研究生物學的基本規律[2]。

但由于生物統計學的理論知識體系和學習方法有別于其他門類的農學課程,理論較抽象,邏輯性又極強,還要求學生要具備高等數學的基礎。無論是試驗設計、數據描述,還是試驗結果的科學分析和推斷,都需要以生物統計學的相關理論和方法為依據。生物統計學主要介紹了顯著性檢驗、方差分析、卡方檢驗和線性回歸與相關分析等內容,公式繁多,同時計算量巨大。因此,很多農學學科的本科生認為這是較難學習和掌握的一門課程,造成學生怕學、不愿學。再加上學生在潛意識中容易形成該課程與專業相距甚遠的錯覺,理論與實踐相脫節,往往造成教學效果不理想。因此,如何將理論和實踐相結合,如何簡化計算分析過程,這就成為提高該課程教學效果、提高學生學習興趣的主要切入點。

Excel是Microsoft微軟公司推出的辦公軟件Office的組件之一,是由Microsoft為Windows和Apple Macintosh桌面操作系統以及Android和iOS移動操作系統而編寫和運行的一款軟件。Excel中包含了大量的函數和公式,可以進行各種數學運算、數據處理、統計分析、輔助決策和制作圖表等,廣泛地應用于管理、統計、財經和金融等眾多領域。將Excel運用到生物統計學中的統計分析計算中,可大大簡化計算過程。Excel 軟件提供了300 多個工作表函數,與生物統計學有關的有40~50 個[3]。本文通過幾個科研生產中的實例,來說明如何運用Excel進行統計分析。以Excel 2003為例進行介紹,其他版本過程基本一致。

1 實例分析

1.1 非配對設計兩樣本顯著性檢驗(t檢驗)

例如:現有2個品種的商品豬“杜洛克”和“漢普夏”,為了比較這2個品種的生長性能哪個更優,每個品種選取30日齡、初始體重相近、性別相同的豬各10頭,分成2組,飼喂配方相同的飼料,試驗期中控制每頭豬的采食量相同。50 d試驗期后增重結果如表1所示。

首先需要在Excel中添加“分析工具庫”這個功能。點擊“工具”菜單,選擇“加載宏”,在彈出的對話框中,將“分析工具庫”打上對勾,點擊“確定”(圖1)。這樣,在“工具”菜單下,就增加了一個“數據分析”的功能[4]。將以上數據輸入Excel,從任意一個單元格開始輸入皆可,將以上數據全部輸入Excel。輸入完畢后點擊“工具”菜單,選擇“數據分析”,在彈出的對話框中選擇“t檢驗:雙樣本等方差假設”(圖2)。在彈出的對話框中,變量1的區域,用鼠標將“杜洛克”的所有數據選中。注意,如果將“標志”前打上對勾,則說明第1個單元格“杜洛克”3個漢字是標志,不參與計算,僅作為標簽。此時選中的時候應將“杜洛克”3個漢字也選中;如果“標志”前不打對勾,則不用選中“杜洛克”3個漢字?!唉粒ˋ)”:后面的空格代表顯著水平,可以填寫常用的顯著水平0.05或0.01。如果填寫0.05,軟件計算的結果將會顯示0.05顯著水平的臨界t值以及計算結果。如果填寫0.01,軟件計算的結果將會顯示0.01顯著水平的臨界t值以及計算結果。先填寫0.05,點擊“確定”(圖3)。這時軟件將自動計算出結果(圖4)。從結果中可以看到,軟件計算出了2個樣本的平均數、方差、t值、在5%顯著水平下的臨界t值以及無效假設成立的概率P值。t值為2.010 951 394,0.05顯著水平臨界值t0.05為2.100 922 037,t5%,差異不顯著,即說明同等條件下杜洛克和漢普夏2個品種的增重效果差異不顯著。然而結果中已經包含了無效假設成立的概率P值,即0.059 552 796,約等于5.955%,這說明P>5%,差異是不顯著的??梢灾苯訌母怕手祦砼袛?。再在“α(A)”:后面的空白處填寫0.01,點擊“確定”,這時軟件將自動計算出顯著水平為0.01時的分析結果(圖5)。從結果可以看出,除了臨界t值不同之外,和0.01顯著水平的分析結果是完全一樣的。t值為2.010 951 39,0.01顯著水平的臨界t值t0.01為2.878 440 47,t

1.2 配對設計雙樣本顯著性檢驗(t檢驗)

某豬場從10窩大白仔豬中每窩抽取性別相同、體重接近的仔豬2頭,將這2頭仔豬隨機分配到2個飼料組,進行飼料對比試驗,試驗時間30 d,仔豬增重資料列于表2。檢驗2種飼料飼喂的仔豬平均增重是否相同。

這個實例是統計試驗中的兩樣本配對設計,Excel中同樣提供了相應的函數,首先將數據輸入Excel,然后點擊“工具”菜單,選擇“數據分析”,在彈出的對話框中選擇“t檢驗:平均值的成對二樣本分析”,點擊“確定”。在彈出的對話框中“變量1的區域”用鼠標選擇“飼料一”的所有數據,再重復以上步驟輸入“變量2的區域”。先計算顯著水平為0.05的分析結果,點擊“確定”,軟件將自動計算出結果(圖6)。從結果中可以看出,軟件計算出了2個樣本的平均值、方差、t值、臨界t值和無效假設成立的概率。t值為3.455 282 943, 0.05顯著水平的臨界t值t0.05為2.262 157 158,t>t0.05,即P<5%,在0.05顯著水平上差異是顯著的,即2種飼料的增重效果差異顯著。再計算0.01顯著水平上的結果。重復上述步驟,所不同的是在“α(A):”后的空白處填上0.01,這時軟件將會計算出0.01顯著水平的分析結果(圖7)。從結果可以看出,除了臨界t值和0.05顯著水平不同之外,其他都是相同的。t值為3.455 282 943,0.01顯著水平的臨界t值t0.01為3.249 835 5,t>t0.01,即P<1%,因此在0.01水平上同樣差異顯著,即差異極顯著[5]。

1.3 多樣本的顯著性檢驗(方差分析)

某水產研究所為了比較4種不同配合飼料對魚的飼喂效果,選取了條件基本相同的魚20尾,隨機分成4組(A1、A2、A3、A4),投喂不同的飼料,經1個月試驗后,各組魚的增重結果列于表3。

分析這4種飼料對魚的增重效果孰優孰劣。本實例屬于方差分析的范疇,Excel同樣提供了相應的函數。首先將所有數據輸入Excel,點擊“工具”菜單,選擇“數據分析”,在彈出的對話框中選擇“方差分析:單因素方差分析”,點擊“確定”。在彈出的對話框中,軟件要求輸入數據的區域,用鼠標選定所有數據區域。分組方式有“行”和“列”2種可選擇,具體取決于在Excel中輸入數據的方式。先計算0.05顯著水平的結果,“α(A):”后面的空白處填上0.05,點擊“確定”,軟件將自動計算出結果(圖8)。結果中包含了各個處理的和、平均值和方差。以及處理間和處理內的平方和(SS)、自由度(df)、均方(MS)、F值、臨界F值(F crit)和無效假設成立的概率(P-value)。從分析結果可以看出,這4種飼料對魚的增重效果從優到劣的順序是A1(31.18)、A4(27.96)、A2(26.28)和A3(24.74)。F值為7.136 175,0.05顯著水平的臨界F值F0.05為3.238 872,即F>F0.05,即P<5%,因此在0.05顯著水平上差異顯著,即4種飼料對魚的增重效果差異顯著。再計算0.01顯著水平上的分析結果。重復上述步驟,不同的是在“α(A):”后面的空格處填寫0.01。從結果可以看出(圖9),除了臨界F值不同以外,其余都和0.05顯著水平的結果相同。F值為7.136 175,0.01顯著水平的臨界F值F0.01為5.292 214,即F>F0.05,即P<1%,因此在0.01顯著水平上差異顯著,也就是差異極顯著,即4種飼料對魚的增重效果差異極顯著[3]。

1.4 雙變量直線回歸與相關

為了研究胰島素的注射量和血糖濃度減少量之間的關系,取10只相同條件下繁殖的大白鼠,分別注射不同的胰島素劑量,胰島素的注射量(x)和血糖濃度減少量(y)的值列于表4。

上述實例屬于統計學中回歸與相關的研究范疇,Excel同樣提供了解決此問題的相關函數。首先將所有數據輸入Excel中,需要了解這2個變量是否相關,如果相關,是什么類型的相關,以及相關的程度有多強,可以根據散點圖來判斷。點擊“插入”菜單,選擇“圖表”,在彈出的對話框中選擇“XY散點圖”,“子圖表類型”選擇不帶線條的類型,點擊“下一步”。此時軟件要求輸入數據的區域,用鼠標選擇所有數據的區域?!跋盗挟a生在”有“行”和“列”2個選擇,這取決于數據輸入的方式。點擊“下一步”。圖表標題填寫“胰島素注射量和血糖濃度減少量關系圖”,數值(X)軸填寫“胰島素注射量”,數值(Y)軸填寫“血糖濃度減少量”,點擊“下一步”,點擊“完成”。此時軟件將自動生成一個散點圖(圖10),可以看出2個變量有很強的直線相關關系。還可以進一步計算出直線回歸方程。右鍵點擊任意一個點,彈出的菜單中選擇“添加趨勢線”,在彈出的對話框中“類型”選項卡中“趨勢預測/回歸分析類型”選擇“線性”,“選項”選項卡中在“顯示公式”前打上對勾,點擊“確定”。此時軟件計算出了“胰島素注射量”和“血糖濃度減少量”之間的直線回歸方程(圖11),即y=84.485x+11.994,胰島素每增加1個注射單位,血糖濃度相應地減少84.485個單位[3]。

2 結語

本文介紹了Excel軟件在數據處理方面的基本操作方法,基本涵蓋了生物統計學中所有的實例。本人在教學實踐中發現,由于Excel軟件操作過程并不復雜,所以學生掌握起來很容易,簡化了計算過程,學生可以將更多的精力投入到試驗的前期設計和試驗過程的操作中。同時也提高了學生的學習興趣,使教學效果大大提高。Excel并不是專業的統計分析軟件,但是它依然提供了強大的數據處理能力。由于農林類高校所開設的生物統計學課程只是初步的統計學,故Excel軟件所提供的數據處理能力也基本夠用了。如果要進行更專業的數據分析,可借助于專業的統計分析軟件,如SPSS和SAS,可進行方差分析的LSD、LSR多重比較、多元線性回歸、復相關分析、偏相關分析、協方差分析和非參數檢驗等。

3 參考文獻

[1] 李六林.提高《生物統計學》教學效果的探討[J].山西農業大學學報(社會科學版),2009,8(1):94-97.

[2] 章平.提高養殖專業??粕渡锝y計學》學習興趣的方法探索[J].畜牧與飼料科學,2013,34(4):26-27.

[3] 范平,崔黨群,詹克慧,等.Excel軟件在生物統計實驗教學中的綜合開發應用[J].實驗技術與管理,2003,20(2):65-69.

[4] 詹秋文.Excel和SAS在生物統計學的應用比較[J].生物學雜志,2009,26(1):74-75.

[5] 明道緒.生物統計附試驗設計[M].5版.北京:中國農業出版社,2014.

猜你喜歡
方差分析
Excel在《生物統計學》雙因素有重復方差分析中的應用與探討
高校二手書市場細分研究
應用統計學課堂教學組織實踐與探索
金華市大學生幸福感調查研究
“互聯網+”時代的出租車資源配置
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合