?

數學建模中的幾種數據處理方法

2015-12-23 02:27
科技視界 2015年30期
關鍵詞:插值數據處理建模

劉 佳

(淄博職業學院,山東 淄博 255314)

隨著科學技術的發展,數學的應用范圍日益廣泛。數學建模是利用數學方法解決實際問題的一種實踐,它有助于提高學生學習數學的積極性,提高學生建立數學模型和運用計算機技術解決實際問題的能力,以及培養學生創新精神和合作意識,因此數學建模以及數學建模競賽受到廣泛關注。在建立數學模型時首先要分析變量,要盡可能的找全研究對象所涉及的量,分清變量主次地位,忽略引起小誤差的變量,簡化數學模型。分析變量之間的關系,第一步要對數據做處理,即對原始數據做適當變換或其他處理,從中發現隱藏的數學規律,因此數據處理非常重要。本文總結了數學建模中常用的幾種數據處理方法,并給出相關軟件的調用命令。

1 數據的錄入與保存

對數據進行處理首先要學會如何錄入保存數據,在Excle 軟件與Spss 軟件中都是以工作表的形式存儲數據,在Matlab 中可以用數據文件.mat 的形式保存數據。Mat 文件是Matlab 以標準二進制格式保存的文件,可將空間中有用的數據變量保存下來。Mat 文件的生成和調用是由函數save 和load 完成的。例:A 是一矩陣,對其賦值,通過命令save data1 A 就會把矩陣A 數據保存在文件data1.mat 中了,若要調用矩陣A,則通過命令lada data1 就會將矩陣A 中的數據加載在當前工作環境中。

2 基本的數據分析

在數學建模競賽中,我們常常要求一組數據的平均值、最大值、最小值、中位值、方差等基本統計量,利用Excle 可以方便求得。此外我們還可以利用Excle 繪制直方圖、概率分布圖、頻數直方圖等。Excle可以方便的實現對數據排序、篩選、分類匯總等基本的數據處理。這些基本的數據分析方法是進行數據分析的第一步,它清晰地反應數據的基本走勢。

3 插值與擬合

在建模競賽中經常會碰到這樣一種問題,要從一組實驗觀測數據揭示自變量x 與因變量y 之間的關系,這就需要用到插值與擬合方法。例如2004 年國賽C 題中提供酒后幾個時間段人體酒精含量的數據,給出酒后血液中酒精含量與時間的函數關系,這就用到插值與擬合。插值是指在平面上給定一組離散點列,要求一條曲線,把這些點按次序連接起來。利用插值法可以得到這些點以外的其它地方的數值。常用的插值方法有拉格朗日多項式插值、牛頓插值、分段線性插值、Hermite 插值和三次樣條插值。Matlab 軟件中自帶插值工具箱,可以方便的進行各種插值。例:一維插值函數interp1,語法為y=interp1(x0,y0,x,‘method’),(x0,y0)為插值點,x 為被插值點,y 為插值結果。method 指插值的方法,默認為線性插值,也可以為‘nearest’最近插值,‘linear’線性插值,‘spline’立方樣條插值,‘cubic’立方插值。三次樣條插值有以下幾種函數:y=interp1(x0,y0,x,‘spline’),y=spline(x0,y0,x),pp=csape(x0,y0,conds)等。擬合也是已知有n 個數據點(x1,y1),(x2,y2)……(xn,yn),求近似函數不要求過已知數據點,只要求在某種意義下它在這些點上的總偏差最小。擬合最常用的方法是線性最小二乘法,基本思想是先選定一組函數r1(x),r2(x)……rm(x)(m<n),要根據實際問題進行機理分析確定r1(x),r2(x)……rm(x)(m<n),令f(x)=a1r1(x)+a2r2(x)+……+amrm(x),其中a1,a2,……am為待定系數,再利用最小二乘準則確定a1,a2,……am,也就是使n 個點(xj,yj)與曲線y=f(x)的距離δj的平方和最小。記:

問題歸結為求a1,a2,……am,使J(a1,a2,……am)最小。

特別的若用多項式f(x)=a1xm+……+amx+am+1擬合,Matlab 軟件提供命令a=polyfit(x,y,m),m 為擬合多項式次數,(x,y)為要擬合的數據,a為輸出的多項式的系數。

4 回歸分析

回歸分析也是常用的一種數據處理方法,當客觀事物內部規律比較復雜,無法分析實際對象內在的因果關系,那么通常的辦法是搜集大量的數據通過對數據的統計分析建立模型?;貧w分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,按照自變量的多少,從一組數據出發,確定某些變量之間的定量關系式,即建立數學模型并估計其中的未知參數,再對這些關系式的可信程度進行檢驗,這是非常重要的一步。在回歸分析中要將影響顯著的自變量納入模型,剔除影響不顯著的變量,這一步通常用逐步回歸法。我們還可以利用所求的關系式對某一生產過程進行預測或控制。利用數學軟件可以方便地實現回歸分析,比如Matlab 軟件中命令regress(),polyval(),rstool()都能進行回歸分析。

5 聚類分析與主成分分析

聚類分析與主成分分析是多元分析的最基本內容,也是數學建模中常用到的方法。比如2012 年國賽葡萄酒評價問題、2013 年城市公共自行車問題都可以應用聚類分析、主成分分分析這類統計分析方法。近年來,隨著數據處理問題越來越多地出現在數學建模競賽中,這一類建模方法也越發受到重視。聚類分析是將樣品或變量按相似程度劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。聚類分析主要分為Q 型分析與R 型分析,Matlab 軟件中linkage()與pdist()結合可以進行聚類分析。主成分分析的原理,是以較少數的綜合變量取代原有的多維變量,使數據結構簡化,把原指標綜合成較少幾個主成分,這幾個主成分是原來若干個指標的線性組合,它們能盡可能的反應原始變量的信息,且彼此不相關,主成分分析實際是一種降維方法。Matlab 中函數pcacov、princop、pcares 都可以進行主成分分析,我們以pcacov 為例說明一下主成分分析的調用方法。[coeff,latent,explained]=pcacov(v),其中v是總體或樣本的相關系數矩陣,輸出coeff 是p 個主成分的系數矩陣,explained 是這p 個主成分各自的貢獻率。

數學建模過程中,掌握高效、便捷的數據處理方法是解決問題的關鍵一步。近年來,數學建模競賽的難度越來越大,特別是貼近實際生活的大量數據的融入增加了題目的難度,傳統的數學模型逐步淘汰,掌握多種數據處理方法非常必要。本文歸納和總結了數學建模中經常遇到的數據處理方法,希望對提高學生數學能力、處理實際數據問題的能力有所幫助。

[1]姜啟源,謝金星,葉俊.數學模型[M].第3 版.北京:高等教育出版社,2003.

[2]司守奎,孫璽菁.數學建模算法與應用[M].北京:國防工業出版社,2011.

[3]何曉群.多元統計分析[M].第2 版.北京:中國人民大學出版社,2012.

猜你喜歡
插值數據處理建模
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
聯想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
基于Sinc插值與相關譜的縱橫波速度比掃描方法
基于PSS/E的風電場建模與動態分析
不對稱半橋變換器的建模與仿真
一種改進FFT多譜線插值諧波分析方法
基于四項最低旁瓣Nuttall窗的插值FFT諧波分析
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
Blackman-Harris窗的插值FFT諧波分析與應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合