?

運動數據中的最優關聯數據的分類分析

2018-01-02 00:48廖志錦
現代電子技術 2017年24期
關鍵詞:特征提取數據挖掘

廖志錦

摘 要: 針對傳統的分類方法在對運動數據的最優關聯數據進行分類時,存在分類誤差大、效率低的問題,提出基于決策樹尋優的運動數據中的最優關聯數據的分類算法。采用有向圖模型構建運動數據的最優關聯數據分布式結構模型,對采集的運動數據進行非線性時間序列特征重構,在重構的運動數據高維特征空間中進行運動數據的關聯性映射,提取反映運動數據類別的屬性特征,通過決策樹尋優方法實現運動數據的自適應分類。仿真結果表明,采用該方法進行運動數據中的最優關聯數據分類,其準確性較好、誤分率較低,從而有效挖掘運動數據的關聯信息,實現運動特征監測。

關鍵詞: 運動數據; 關聯數據; 分類算法; 數據挖掘; 特征提取

中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)24?0053?03

Abstract: In allusion to the problem that big error and low efficiency exist in the traditional classification method of optimal association data classification for motion data, the optimal association data classification algorithm based on decision tree optimization is proposed for motion data. The directed graph model is adopted to construct the optimal association data distributed structure model for motion data. The nonlinear time series feature is reconstructed for the collected motion data. Association mapping of motion data is performed in the reconstructed high?dimensional feature space of motion data to extract the attribute features reflecting motion data categories. The decision tree optimization method is adopted to realize adaptive motion data classification. The simulation results show that the method has good accuracy and low error in optimal association data classification for motion data, and can perform effective association information mining for motion data to realize motion feature monitoring.

Keywords: motion data; association data; classification algorithm; data mining; feature extraction

隨著大數據信息處理技術的發展,采用大數據信息處理方法進行體育運動數據的信息處理和加工,分析運動數據中的關聯性屬性特征,提取運動數據中能反映人體運動信息的關鍵特征參量,實現人體運動的狀態特征監測和模式識別,指導體育運動實踐。對運動數據的最優關聯分類是實現運動數據的關鍵特征挖掘和信息提取的關鍵,實現運動數據的在線實時監測和管理,從而掌握運動員的運動水平。數據分類又是數據聚類,其原理是挖掘反應數據屬性類別的信息特征量,根據提取的特征量為信息導引值,實現大數據分類識別。傳統方法對運動數據的關聯數據分類方法主要采用模糊C均值聚類、K均值聚類、近鄰點網格分類等[1?2],上述方法在對大規模運動數據分類中存在計算開銷過大,分類的準確性不好等問題。對此,本文提出基于決策樹尋優的運動數據中的最優關聯數據的分類算法,并進行了數據分類的仿真實驗,得出有效性結論。

1 運動數據的分布式結構分析與特征重組

1.1 運動數據非線性時間序列特征

為了實現運動數據中的最優關聯數據的分類,采用網格式分布結構模型進行運動數據的網格分割,建立運動數據的最優關聯的圖結構模型?;跊Q策樹尋優方法進行運動數據的關聯屬性特征提取和自適應分類,決策樹模型采用C4.5的Domain knowledge決策樹模型[3],決策樹的根節點為運動數據分類的初始網格分割節點,通過對兩組相似的運動數據的屬性判斷和相關性特征重組,采用檢索節點圖模型分組方法進行運動數據分類。根據上述設計原理,得到運動數據的分類的決策樹模型如圖1所示。

在大數據背景下進行運動數據最優關聯分類設計,人體運動數據圖模型結構用二元有向圖表示,運動數據隨邊分布特征記為:

假設運動數據在決策樹中的分類節點的邊集為A,網格分割的時間窗口函數為,通過對運動數據進行多重小波分解[4],采用時頻分析方法,得運動數據關聯維分割代價函數表述為:

式中,是運動數據最優關聯子集的自回歸特征向量。在有向圖決策樹模型中進行人體運動數據的最近鄰點采樣,根據上述設計,對采集運動數據進行非線性時間序列特征重構。

1.2 運動數據關聯性映射

在重構的運動數據高維特征空間中進行運動數據關聯性映射,提取反映運動數據類別屬性特征,運動數據高維特征空間狀態函數記為:endprint

數據分類自適應權重,二元耦合向量為Y,運動數據行為匹配評價指標集,在高維特征空間中,存在一個數據對象y,在有限論域內[5],運動數據分類向量決策樹分叉距離為,用二元回歸分析法構建運動數據分類關聯性映射為:

在關聯規則映射體系中,構建運動數據屬性識別的本體模型,通過本體結構的模板匹配,進行運動數據的關聯數據分類識別。

2 運動數據分類算法實現

在進行運動數據的數據結構分析和分布式結構模型的基礎上,進行運動數據的最優關聯數據分類設計。本文提出一種基于決策樹尋優的運動數據中的最優關聯數據的分類算法。首先提取反映運動數據類別的屬性特征,根據運動數據的暫態性擾動關聯性分布特性,構建反映運動數據主特征量的決策樹分叉圖[6],得到運動數據分類的屬性特征提取結果為:

以上述屬性特征提取結果為輸入,假設分類的維數為,那么,運動數據在決策樹中分類的葉節點元素為,校驗元素中含有個根節點,通過自組織神經網絡映射[7],得到關聯數據分類的加權權重滿足。設運動數據的信息歸類誤差為,則在不同的網格區域內構建運動數據分類的協方差矩陣為:

式中,為點的相似度矩陣,通過求取運動數據最優關聯數據主特征量,計算運動數據分類的聚類中心:

計算相鄰聚類屬性特征點的聯合概率密度特征,令為運動數據分類的四元組,即,大數據分類屬性。根據自相關函數匹配技術,提取反映運動數據類別的屬性特征量,記為:

式中,為聚類中心小擾幅值。如果,則第k類分類的擾動振蕩系數趨于零,如果,則數據分類聚類中心存在擾動[8]。采用關聯函數匹配方法進行擾動抑制[9],假設大數據特征空間給定點集為,得到數據分類輸出信息時間序列為:

式中,在維關聯維特征映射空間中,采集一維數據矢量,用本文決策樹分類方法,將關聯數據劃分成n個簇,根據運動數據的關聯性映射結果,對運動數據分類。

3 仿真實驗

對運動數據中的最優關聯數據的分類的仿真實驗建立在Microsoft Visual C++ 7.0,Vega Prime 2.2.1仿真環境中,采用Matlab編程工具進行數據分類算法設計。運動數據采集來自于某高校對大一本科生統計的田徑體育運動數據,統計時間為2017年1月—4月,運動數據特征采樣的相對時間延遲為0.12 s,最優關聯數據調度路徑的條數為10,幅度參數為(0,1.0,3.0,4.0,5.0),運動數據的相似度關聯系數為m=12,數據特征重構的最大迭代步數歸一化初始采樣頻率Hz,決策樹的Sink節點為55隨機矩陣。根據上述仿真環境和參量設定,進行運動數據中的關聯數據分類仿真,得到運動數據采樣的樣本測試集如圖2所示。

以圖2采集的運動數據為對象,進行運動數據的最優關聯數據分類,采用不同方法進行對比,測試數據分類的誤分率(見圖3),得出本文方法進行運動數據的關聯數據分類誤分率較低,收斂性較好,性能更優。

4 結 語

本文研究了運動數據的優化分類問題,提出基于決策樹尋優的運動數據中的最優關聯數據的分類算法,并進行實驗分析,研究可知,本文方法能有效實現運動數據的最優關聯數據分類。

參考文獻

[1] 劉健,常蓮.基于Bohzmann機的物聯網數據分類方法研究[J].激光雜志,2016,37(10):116?120.

[2] 尚朝軒,王品,韓壯志,等.基于類決策樹分類的特征層融合識別算法[J].控制與決策,2016,31(6):1009?1014.

[3] IHSAN A K, MEHDI G D. Improved accuracy for decision tree algorithm based on unsupervised discretization [J]. International journal of computer science and mobile computing, 2014, 3(6): 176?183.

[4] 王衛紅,嚴魯琴,金丹丹,等.基于GEPSO模型的面向對象遙感圖像分類[J].計算機科學,2015,42(5):51?53.

[5] 匡桂娟,曾國蓀,熊煥亮.關注用戶服務評價反饋的云資源再分配方法[J].計算機應用,2015,35(7):1837?1842.

[6] 張紅蕊,張永,于靜雯.云計算環境下基于樸素貝葉斯的數據分類[J].計算機應用與軟件,2015,32(3):27?30.

[7] 熊忠陽,劉芹,張玉芳.結合項目分類和云模型的協同過濾推薦算法[J].計算機應用研究,2012,29(10):3660?3664.

[8] 楊棽,齊越,沈旭昆,等.一種快速的三維掃描數據自動配準方法[J].軟件學報,2010,21(6):1438?1450.

[9] 李保利.基于類別層次結構的多層文本分類樣本擴展策略[J].北京大學學報(自然科學版),2015,51(2):357?366.endprint

猜你喜歡
特征提取數據挖掘
探討人工智能與數據挖掘發展趨勢
基于Gazebo仿真環境的ORB特征提取與比對的研究
基于Daubechies(dbN)的飛行器音頻特征提取
基于并行計算的大數據挖掘在電網中的應用
一種基于LBP 特征提取和稀疏表示的肝病識別算法
數據挖掘技術在中醫診療數據分析中的應用
基于DSP的直線特征提取算法
一種基于Hadoop的大數據挖掘云服務及應用
基于MED和循環域解調的多故障特征提取
數據挖掘的分析與探索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合