?

基于優化Grid Search-SV M算法的服裝版型分類預測研究

2020-04-28 06:53鄭文靖
紡織科技進展 2020年4期
關鍵詞:超平面版型網格

鄭文靖

(西安工程大學 計算機科學學院,陜西 西安710048)

當前時代下,隨著消費者對個性化穿著以及對服裝尺寸適宜度要求的擴大,服裝定制模式漸漸在國內占據了重要的市場份額。定制化是能夠滿足消費者對個性化追求的重要途徑,在“互聯網+”時代中,定制行為模式正發生著重要的變革[1-2]。

隨著消費者需求的擴大,傳統的定制模式可能對于眾多的消費者來說,無法及時滿足所有消費者的需求,因此實現服裝定制推薦是當前服裝定制市場的一種趨勢。針對服裝定制領域,目前國內主要聚焦于三維人體建模參與定制,并且多數強調的是款式、面料、部件樣式的選擇,忽略了消費者歷史數據中有用的信息,因此,目前國內外服裝定制推薦領域研究較少。文獻[3]通過交互日志挖掘,采用有限狀態機技術描述客戶需求的會話交互行為模型,并運用約束滿足理論和多屬性效用理論,開發了一種基于約束滿足和情感效用的個性化西服定制推薦系統;文獻[4]基于Kinect描述了一種人體及服裝重構的方法,由多個Kinect捕獲人體模型,對服裝進行3D建模,將其變形以適合人體,然后應用縫合將這些模式縫合在一起;文獻[5]設計和開發了基于專家知識的個性化服裝搭配系統,提供了個性化的服裝搭配服務;文獻[6]采用BDEU決策樹算法,構筑了用戶類別偏好模型,向用戶提供了個性化的推薦服務。以上研究對于服裝定制推薦領域的涉及有限,因此,本文致力于研究服裝定制領域中的量體數據與服裝版型。

在大數據時代下,為方便消費者快速選擇適合自己的定制服裝版型以及面料繡花搭配,通過SV M分類算法對眾多量體數據進行挖掘分析,根據用戶自身的量體數據進行計算后推薦給用戶適合的版型,從而根據版型進一步實現用戶的個性化定制搭配推薦。個性化的定制推薦與傳統的定制選擇相結合,才能為用戶提供更好的定制服務。

1 量體特征值與版型類型的SV M數據模型

1.1 量體數據特征參數集初始化

設量體數據為輸入樣本X,以上衣量體數據為例,x1、x2、x3、…、xn分別為代表不同部位的量體特征值,如衣長、胸圍、下擺、中腰、肩寬、袖長等部位,輸入n個特征值作為樣本值X(Xi)

建立量體數據參數集X={x1,x2,x3,…,xn}

由于量體特征值之間存在較大差異,如胸圍與肩寬之間的差異。需對量體數據集進行歸一化處理,使得參數空間在各維度分布均勻,模型具有較優的迭代速度和分類預測效果。歸一化方法為:

1.2 構造最優超平面

以上衣為例,設X={YC,X W,ZY,XB,JK,XC},YC、X W、ZY、XB、JK、XC分別代表衣長、胸圍、中腰、下擺、肩寬、袖長,設Y=版型分類值,X與Y可表示為:

{(x1,y1),(x2,y2),…,(xn,yn),xt∈Rd,yt∈ {y1,y2,…,yn}}

此關系模式下必然存在n-1個超平面,將這些樣本分別兩兩區分,最終實現分類效果,超平面可表示為:

式中,w∈Rd為該平面的權值法向量,b∈R為偏置量。

則樣本到超平面的分類間隔為:2/‖w‖,由于原始樣本空間數據的線性不可分性,因此,引入懲罰參數C來調整支持向量機對已知訓練樣本構建最優分類超平面時分類錯誤容忍程度[7]。所以要建立最優超平面的問題變成在有約束的條件下求:

1.3 計算最優解

為了解決構造最優超平面的問題,引入Lagrange函數[8]:

式中,ai≥0,i=1,2,…,n為拉格朗日乘子,為了求得w和b的最小值,對w和b求偏導數,并使得它們的偏導數為零,即:

對于已知訓練樣本 (xi,yi),求使得L(w,b,a)取得最大值時的ai,將二次規劃問題轉化為相應的對偶問題,根據Lagrange對偶性原理,將問題中的參數全部轉變為僅以Lagrange乘子作為參數變量的目標式[9-10]:

解得最優解a*=(a1*,a2*,…,an*)'。最優法向量w和最優偏置量b分別為:

根據最優值,從而求得最優分類超平面(w*·x)+b*=0,則其對應的最優分類函數為:

為實現樣本空間從線性分劃到非線性分劃的過渡,引入徑向基(RBF)核函數,將樣本空間從低維映射到高維[11-12]。徑向基核函數表達式為:

則最優分類函數為

2 基于優化Grid Search的SV M分類模型

2.1 Grid Search-SV M原理

懲罰參數C和核函數參數g是影響SV M分類器性能的關鍵參數[13],其中C表示模型對誤差的容忍度。C值太大容易導致過擬合的現象,使得測試集的數據分類效果不佳;C值太小容易導致欠擬合,模型不能有效捕捉樣本的數據特征,泛化能力變差。g是選擇RBF函數作為kernel后,該函數自帶的一個參數,隱含地決定了數據映射到新的特征空間后的分布,g越大,支持向量越少,g值越小,支持向量越多。g值過大過小,表明原始樣本被映射至并不適用的高維空間,無法建立較優的分類模型[14-15]。

Grid Search是用在Libsv m中的參數搜索方法[16],在C和g組成的二維參數矩陣中,依次遍歷網格內所有的點進行取值,對于取定的C和g利用K-CV方法得到在此組C和g下訓練集驗證分類準確率,最終取使得訓練集驗證分類準確率最高的那組C和g作為最佳參數。使用Grid Search算法可以得到全局最優,且C、g相互獨立,便于并行化進行[17-18]。

基于Grid Search-SV M算法的服裝版型分類識別,具體操作是在MATLAB軟件中利用LIBSV M3.14工具包中的SV Mcg For Class.m函數,使用meshgrid方法構建網格,尋找最佳C和g參數,實現用Grid Search優化SV M參數和服裝版型識別,算法如表1所示。

2.2 Grid Search-SV M模型建立

在版型分類預測的過程中,提取量體數據特征值,并進行歸一化處理后,引入RBF核函數,將樣本數據映射到高維空間,再進行SV M模型訓練、參數尋優以及模型驗證,整個版型的預測模型如圖1所示。

表1 Grid Search-SV M算法流程

圖1 Grid Search-SV M版型預測模型

(1)選定訓練集與測試集,對數據集進行劃分。

(2)樣本數據預處理:為了避免各個樣本因子之間量級的差異,減少樣本之間的相互影響,同時保證程序運行收斂加快,需要對樣本因子進行歸一化處理[19-20],在MATLAB中用map min max函數實現其歸一化。

式中,x、min(x)、max(x)分別是原始樣本數據及其最小值、最大值;min(y)、max(y)分別代表歸一化后樣本的最大值、最小值。

(3)引入徑向基核函數(RBF),通過調整g參數實現樣本從低維空間到高維空間的映射,從而實現線性可分。

(4)使用二度Grid Search算法進行SV M模型訓練及C&g參數尋優。

粗略搜索階段 定義初始網格,設置大步距,獲得局部最優參數區間;

精確搜索階段 以最優參數組為搜索中心,設置小步距,不斷擴大搜索范圍,逐步跳出局部最優,獲得全局最優解,從而實現分類效果最優。

3 試驗結果與分析

(1)試驗數據來自于某大型服裝企業平臺,試驗共采用169組量體數據與版型之間的對應數據,隨機選取131個樣本作為訓練集,38個樣本作為測試集,見表2。

表2 量體數據版型數據集(上衣部分示例)

(2)首先設定所要搜索的(C,g)參數的初始網格搜索范圍及初始步長,其中,C&g的初始網格搜索范圍為[2-10,210],初始步長為4.5,通過交叉驗證方法獲得局部最優參數組;

(3)在其附近進行小范圍的精確網格搜索,其C的網格搜索范圍為[2-2,24],g的網格搜索范圍為[2-4,24],其搜索步長為0.05;

(4)將最終得到的參數(C,g)重新傳入到支持向量機的和函數中,建立基于二度網格搜索的支持向量機模型。

試驗結果如圖2所示。

從試驗結果看出,將Grid Search-SVM算法運用于服裝版型的預測分類研究中,有良好的分類效果,且將Grid Search網格搜索算法分步搜索,可大大縮短參數尋優時間,本次試驗運行時間為4.47 s,最佳C參數為36.7,g參數為1.3,最終試驗的版型分類準確率在90%以上,收斂情況好時可達到100%。

4 結語

為挖掘量體數據與服裝版型的關系,構造出量體數據及服裝版型之間的SV M數據模型,并通過Matlab進行仿真試驗,使用SV M算法進行模型訓練及模型驗證,實現分類效果,并通過Grid Search二度網格搜索算法進行參數尋優,使準確率達到理想狀態。量體數據及版型的預測研究實現了在服裝定制推薦過程中根據量體數據進行版型推薦的過程,使得服裝定制推薦的過程向前推進,逐步實現服裝定制元素的推薦。針對量體數據及版型的研究對服裝定制推薦有重要的理論與實踐意義。

圖2 試驗結果

猜你喜歡
超平面版型網格
背帶褲
一種改進的多分類孿生支持向量機
基于非線性核的SVM模型可視化策略
有限維Banach空間中完備集的構造
追逐
浪漫剪裁
重疊網格裝配中的一種改進ADT搜索方法
Gianluca Capannolo
東西方服裝版型的共性與區別
購套裝識版型——妙法ABC
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合