?

基于時間序列分析的新能源汽車銷量預測研究

2022-10-17 08:32汪斯凱劉吉華
統計與管理 2022年7期
關鍵詞:汽車銷量銷量新能源

汪斯凱 劉吉華

(湖北大學商學院,湖北 武漢 430062)

一、引言

從新型冠狀病毒爆發的2019年開始,疫情在全球范圍內不斷反復,對消費者的購買意愿產生了嚴重影響。以汽車行業為例,從網站 “汽車之家”的統計數據得出,2022年5月全國汽車銷量為133.8萬輛,相比于2021年5月的全國汽車銷量同比下降21.7%,2022年1-5月全國汽車累計銷量為731.3萬輛,同比下降17.3%。由此可見,我國汽車行業面臨著比較惡劣的市場經濟形勢。而新能源汽車僅占2022年5月的市場份額的19.7%,相比于傳統的燃油汽車更是困難重重。所以為減輕汽車行業供應鏈的各個階段的壓力,做出精準的市場需求預測,更有助于供應鏈上游下游各廠商提前做好充足準備,合理分配好資源,按需生產,降低庫存,減少庫存成本,從源頭上節約成本開銷,提高整體收益。

而對于近幾年才逐漸擴大銷量,并占據了一定市場份額的新能源汽車其銷售購買數據具有以下特點:消費者特征較為年輕、歷史銷售數據時間跨度較短、銷售數據量較小等等[1]。目前年輕的消費者群體的普遍購買行為都會基于目前的大量網絡信息進行考慮之后再進行決策購買,而且本國的大部分網絡搜索數據研究基本上都來源于百度指數,雖然將網絡搜索數據納入研究特征是一個不錯的選擇,但是百度指數就目前本國市場上大部分的新能源汽車的搜索數據基本上都沒有收錄,所以本文仍以傳統的歷史銷售數據進行汽車銷量的預測,將純電動的新能源汽車作為研究對象,結合LSTM(長短期循環神經網絡)和時間序列分析的SARIMA進行擬合預測,探究問題如下:如何構建LSTM模型和 SARIMA模型對汽車銷量進行預測?兩模型對數據的擬合效果有什么差異?是否能通過改進分析方法來提高對汽車銷量預測的精度和準確性?

二、文獻綜述

汽車銷售預測研究有著很長時間的發展,眾多學者都為該領域獻力許多,并在理論和實際應用上取得了重大的突破。其中,經典統計學方法已經發展了很長時間,理論也非常成熟,在各種實際問題上得到了廣泛的應用。然而,由于數據采集成本高、樣本數量有限以及傳統預測方法本身存在一些缺陷等原因,使得其適用范圍受到限制。因此,如何提高汽車銷量預測模型的準確性成為一個重要研究課題。

近幾年來,隨著機器學習、神經網絡等數據挖掘技術的逐漸興起,越來越多的學者也開始將這些技術應用到汽車銷量預測中[2]。如:謝亞南提出了基于結構關系識別的汽車銷量預測方法[3];丁銳等人提出的基于SARIMA和LSTM組合預測模型[4];陳科秀等人提出的基于ARIMA的新能源汽車銷量預測模型[5];劉吉華等人基于卷積神經網絡構建了汽車銷量預測模型[6];崔東佳等人將網絡搜索數據正式的帶入汽車銷量預測[7]等。

在汽車銷量的預測問題中,大部分學者都將時間跨度較大、市場份額較高的燃油汽車作為研究對象,對比于燃油汽車,新能源汽車的銷量預測有著極大的困難:

第一、運用大數據、神經網絡等一系列技術手段進行銷量等一系列生產經營活動的預測需要大量的數據支撐,而新能源汽車作為近幾年發展起來的行業,并沒有大量的數據能夠很好的進行模型的擬合和訓練;第二、新能源汽車作為面向未來的綠色環保產業,需要設計高科技等一系列元素作為看點吸引消費者,這種類型的產品基本都具有生命周期段、迭代快速等特點,導致新能源汽車的歷史數據并不能很長;第三、新能源產業作為國家重點關注對象,政府也出臺了很多有關新能源汽車的政策,對汽車的銷量也有比較大的影響;第四、目前全球疫情不斷反復,也導致消費者的購買欲望明顯降低,對銷量的預測有重大的影響。

本文在神經網絡的有關知識的基礎上,提出了針對純電新能源汽車的基于LSTM的汽車銷量預測模型,通過與SARIMA的預測模型的對比,試圖找出高精度的新能源汽車的預測模型。

三、研究模型

(一)SARIMA模型

SARIMA (Seasonal Autoregressive Integrated Moving Average)是在ARIMA模型的基礎上,進行了改進?,F實生活中,經濟類數據常常存在周期性,需要加入季節性調整項,消除原始數據的周期,而汽車歷史銷售數據就具有很強的季節性,所以用該模型非常合適。

設Xt={x1,…,xt,…,xn}為時間序列數據,xt為t時刻的觀測值,記B為延遲算子,表示如下:

SARIMA模型和其他的時間序列模型一樣,其的建立需要平穩非白噪聲時間序列數據,通常先對數據進行差分,定義差分算子見 (2)。部分情況下,經過一階差分仍然無法轉換為平穩序列,則需進行多次差分,則d階差分表示為公式 (3)。

SARIMA模型由自相關部分和移動平均部分組成,經過差分后的序列可以探究其各部分的函數形式。假設φi代表自回歸系數,則p階自回歸模型形式見 (4)。引入p階自回歸算子Φ(B)[8],則p階自回歸模型見 (6)。

由誤差及其不同滯后期構建,主要擬合除變量之外的其他無法觀測的噪聲因素。移動平均模型的模型形式見 (7)。定義q階移動平均算子 Θ (B),則q階移動平均模型見 (9)。

ARIMA(p,d,q)模型可以在對原序列進行d階差分后,用自回歸部分和移動平均部分表示,表達式見 (10)。

令P表示季節性自回歸階數,Q表示季節性移動平均階數,D為季節差分階數,記S為原始序列的季節周期,引入季節性自回歸算子ΦS(Β),季節性移動平均算子ΘS(B),則SARIMA模型的形式如下 (11):

時間序列模型如SARIMA模型的求解一般包括四步:數據處理、模式識別、模型檢驗、預測。而其中最需要注意的模型構建方法就是數據處理和模式識別。

在構建SARIMA模型之前,需要的對數據進行檢驗處理,判斷數據是否平穩且是否為白噪聲。判斷是否平穩所使用的方法一般是由畫圖確認和通過ADF(單位根檢驗)來判斷滯后階數和確認該數據是否平穩,若該數據不平穩則需進行差分,進而轉換為平穩序列;而判斷是否為白噪聲的方法一般通過純隨機數序列檢驗來判斷其各個滯后階數的P值是否小于0.05,純隨機數序列檢驗的原假設為純隨機數序列,P值小于0.05則拒接原假設,認為該數據為非純隨機數序列。

在處理好數據之后,就需要進行模式識別,判定如何構建模型。主要有兩種方法,圖示法和數值法。圖示法通過觀察平穩序列的自相關圖ACF和偏自相關圖PACF定階;數值法主要通過信息準則AIC、SBC等確定階數[9]。也有學者將兩者結合,先通過圖示法大致確定階數范圍,然后循環階數選擇信息準則最小時的階數組合[10]。

(二)LSTM模型

LSTM (Long Short Term Memory),全稱長短期循環神經網絡,是RNN(循環神經網絡)的一種特殊模型,是由Hochreiter等人提出,被 Alex Graves進行了改良和推廣[11]。LSTM之所以被廣泛使用,是因為其可以解決長期的信息依賴問題,這是不能被解決的在其他神經網絡模型中。

LSTM也具有類似于RNN的鏈狀結構,但擁有著與標準RNN所不同的重復模塊結構。其中并沒有單一的神經網絡層,取而代之的是由四個激活函數所組成的神經網絡層,以一種非常特殊的方式相互作用,如圖1所示。

圖1:LSTM中的由四個交互的神經網絡層組成的重復模塊

1、LSTM的核心思想

LSTM運行的關鍵是單元狀態 (cell state)。是 LSTM可以解決長期依賴關系的重要構思。它直接沿著整個鏈條運行,在重復模塊運行過程中,只通過線性交互進行一些微小的改變。從上一模塊傳進來的信息Ct-1沿整條線路進行細微的改變,輸出信息Ct到下一個模塊。

LSTM中能夠對單元狀態進行增刪改的關鍵結構被稱為“門”,是LSTM的核心概念,其可以精準的控制信息的通過量。它主要由激活函數Sigmoid的神經網絡層和逐點乘法計算構成。

LSTM具有三個門,分別為 “遺忘門”、“輸入門”和 “輸出門”,三個門共同對單元狀態進行增刪改的信息量操作,用來確定輸入數據的輸出量和保持量。

2、遺忘門

LSTM運行過程中的第一步是通過 “遺忘門”控制什么信息從細胞狀態中刪除,該門會讀取數據ht-1和xt,通過激活函數Sigmoid將一個零到一之間的數值傳遞給重復模塊中的初始細胞狀態Ct-1[12]。函數表達式為 (12)。

3、輸入門

第二步則是通過 “輸入門”控制需要對細胞狀態進行更新的信息量。這一步分為兩部分。首先,通過 “輸入門”進行計算確定需要更新it數量的信息,函數表達式為 (13)。然后,再通過一個tanh激活函數創建一個新候選值的向量t,決定輸入數據中有那些需要更新到細胞狀態中,函數表達式為(14)。在下一步中,LSTM 對it和t進行向量乘法,將通過兩個值的乘法計算對單元狀態進行更新。

4、更新單元狀態

在進行了前面的 “遺忘門”和 “輸入門”操作后,LSTM就會更新舊的單元狀態Ct-1,創建并形成新的單元狀態Ct。過程是將舊單元狀態Ct-1乘以ft,“遺忘”之前決定要刪除的信息。然后加上 “輸入門”需要添加到單元狀態中的信息 (it*t),函數表達式為 (15),這就是新的候選值,根據 LSTM決定更新每個單元狀態值的程度進行縮放。

5、輸出門

最后,LSTM通過 “輸入門”對需要輸出的信息進行控制?!拜斎腴T”對已經更新的細胞狀態經過篩選的之后的到的信息。和前面幾乎相似,首先,通過sigmoid激活函數,得到需要選擇值為ot的單元狀態,函數表達式為 (16),該值決定了需要從細胞狀態中輸出多少信息。然后,對細胞株那臺進行tanh函數的運算,將其數據轉換成-1到1之間,加速了模型的擬合速度,并將其乘以ot得到輸出的信息,函數表達式為(17)。

綜上所述,LSTM模型能夠很好的處理擁有長期依賴關系的關鍵核心就是,該模型有一個可以持續更新的單元狀態Ct,于此同時,還有可以不斷輸出的ht。

四、基于LSTM模型的汽車銷量模型的構建

通過對不同學者做出的文獻成果的反復研究,本文綜合消費者購買行為模式,提出了如圖2所示的LSTM模型的汽車銷量預測模型[13],共有4部分,分別為:純電新能源車型的選取、數據的采集與預處理、LSTM模型、預測結果分析。

圖2:LSTM汽車銷量預測模型圖

(一)車型的選取

“搜狐汽車網”作為中國汽車網站中信息最快、最全的網站被很多學者都用來作為可靠的數據來源網站。本文對其網站中的車型銷量排行榜中的687個車型進行篩選,將時間長度小于三年的車型去除,從剩余的391個車型挑選出純電動的車型有36個,例如:“吉利帝豪EV”、“長安CS15”、“寶駿E100”、“比亞迪宋EV”、“東風風神E70”、“云度π1”、“蔚來汽車es6”、“蔚來汽車es8” 等。

車型的選取對后序實驗的進行和模型預測結果的準確度的影響極大,所以本文對剩余的36個車型的歷史數據進行逐一對比查看,將其車型歷史銷量中數據空缺長度較大、數據結構不穩定和明顯有誤的車型排除,最后篩選出了以下6個車型:“云度π1”、“小鵬汽車 G3”、“蔚來汽車 ES8”、“比亞迪唐EV”、“廣汽埃安Aion S”、“蔚來汽車ES6”。就查看其六個車型的歷史銷量數據特點來看,該六個車型的銷量數據都比較小,每個月的銷售數據基本上都沒有超過1萬;新浪汽車網的銷量精度為 (萬輛/月),導致新能源汽車銷量的力度較低;并且新能源汽車的銷售時間維度的長度都普遍較短。

(二)數據采集和預處理

1、汽車銷售數據

數據獲取與預處理是建模分析的基礎,高質量的數據以及精準的預處理可以顯著提高模型精度,提高預測效果。該六個車型覆蓋的品牌比較多,車型比較豐富,基本上可以迎合消費者的消費習慣,且生產周期相對較長,數據量比較充足,適合作為研究對象。

本文對該六個車型的汽車各自進行銷量預測,將 “搜狐汽車網”作為汽車銷售的歷史數據的來源,通過Python語言編寫爬蟲腳本,對搜狐汽車網上的這六個新能源汽車的車型和其每個月的汽車銷量進行抓取。圖3為該六個車型的月度汽車銷量,從圖中可以看出其數據具有很強的季節性,在不同的季節,銷量波動比較相似;并且在2019年前后,受疫情的影響,銷量波動比較顯著。

圖3:六個新能源車型月度銷量圖 (萬輛/月)

2、數據集的劃分

在將數據帶入到模型中進行擬合之前,需要對數據集進劃分。因為LSTM模型對數據進行訓練時,數據集的設定有一定的規范,考慮到消費者在進行購車消費之前的決策時間較長,本文將初始的基礎序列長度設置為12月,對接下來的1月進行預測的模型對歷史銷售數據集進行重構。以汽車 “云度Π1”為例,其全部歷史銷量數據為52條一維數據,對數據集按照滑動窗口的方式進行重構之后,數據集變成了41條由13組一維數據組成的數據集。之后再對每個數據集進行拆分,將20%的數據集作為測試集和驗證集,剩余的80%作為訓練集。當然,在進行數據集劃分之前需要對全部六個車型的歷史銷量數據進行空缺值填充,本文采用8鄰域的K-means填充,使數據更接近于原始數據。

3、LSTM模型的構建和訓練

LSTM模型在輸入層方面和其他的神經網絡模型一樣是輸入數據集組成的特征向量矩陣,通過模型內部的 “輸入門”,“遺忘門”,“輸出門”,通過多層的循環,對數據進行擬合,最終通過優化函數不斷地調整參數,使最終模型的損失降到最低。本文對該模型采用的損失函數為平均絕對誤差 (MAE),本文通過調整LSTM模型的可控參數,目的是將誤差值將到最低。

(1)初始模型

目前,基于LSTM的汽車銷量預測模型,眾多學者也都沒有比較泛用的模型,而且在模型的參數的設定上也沒有統一的規定,一般都基于研究者的經驗判斷。由于新能源車型的歷史銷量數據量都比較少,過高的循環和更深的神經網絡層數會導致數據更快地過擬合,不易被發現,而簡單的循環層數和深度會導致訓練次數過多,給機器造成比較大壓力且耗時較多。所以本文就將所有車型的初始模型設定為單層的神經網絡層,輸入層節點為16,訓練完后直接進行單值輸出,編譯模型的優化函數為Adam,采用MAE(平均絕對誤差)作為模型的損失函數,模型進行訓練是每次訓練的數據量為32,總共訓練120輪,用測試集進行數據的驗證。

(2)模型訓練

對六個車型用初始模型進行訓練擬合后的預測值Αt與真實值Ft進行計算MAPE如表1。眾多有關時間序列的研究對模型的評判標準為MAPE(平均絕對百分比誤差),其公式如(18)。從幾次訓練的結果可以看見少數幾個車型如 “廣汽埃安Aion S”,“蔚來汽車ES6”等車型的預測結果還行,其余車型的預測值和真實值的差值比較大,所以需要對這些車型的預測模型進行參數的調整。

表1:各車型的初始模型預測的誤差表

因為整體數據并不復雜且數據量較小,本文對于LSTM模型的主要參數如:輸入層節點數、模型的層數、進行擬合時的每次訓練的數據量的大小 (batch_size)和每輪訓練的擬合次數 (epochs)等進行調整。通過實驗的不斷調整,本文發現模型的節點數、模型的層數和每輪訓練的擬合次數基本呈負相關,模型的節點數和層數決定了模型的復雜程度,更復雜的模型對數據的擬合越快越準,但是對于較小、較簡單的數據來說會導致擬合情況不易被察覺,相應的擬合次數需要降低,以車型蔚來汽車ES8為例,測試實驗結果如表2。而每次訓練數據量的大小很大程度上決定了擬合數據的平滑度,越大會使誤差降低的比較平緩,但對于少量數據而言,取過大的數據量會導致訓練時根本取不到響應的數據量而使擬合結果變差,對其調整的結果如圖4。

表2:參數改變和擬合狀態的關系測試情況表

圖4:不同數據量大小的預測圖像

結合以上經驗,本文對所有的車型分別調整參數重新進行了訓練,尋找最優的預測模型,通過實驗得知,增加模型的層數對于本實驗數據并不能提高模型的預測效果,所以將所有的預測模型設為單層并進行測試,各車型的訓練結果如表3,對測試集用該模型進行預測所得預測值于真實值對照畫散點圖如圖5。

表3:六個車型的預測模型參數與預測誤差表

圖5:六個車型的預測值與真實值的散點圖對比

通過上述實驗,本文通過調整參數確定了六個車型的較優預測模型,對比初始模型MAPE有比較明顯的下降,大部分車型的MAPE基本都下降了10%~30%。接下來需要對數據集的劃分進行優化,在眾多學者的預測模型中,很大部分學者都將基礎序列長度設置為短期、中長期和長期等時間段對數據進行預測,但大多都為經驗所致。本文將以上述模型帶入循環中,將基礎序列長度設為4月到24月,測試各個車型的預測結果和設置的基礎序列長度的關系,尋找最優的基礎序列長度。

本文分別對4到24月進行模型的擬合,每次進行3輪,共5次,最后取均值,查看最終的MAPE的大小來判斷該模型對該基礎序列長度的預測程度的好壞,實驗數據如表4。

表4:六個車型在不同基礎序列長度下預測下一個月的MAPE表

經過測試可以看出每個車型的歷史銷量數據所匹配的基礎序列長度大不相同,但基本上都是基礎序列長度越長,模型的預測精度越高。結合均值,當基礎序列長度為19月時,上述六個車型的預測模型相對精準。

綜上所述,可以得到用LSTM模型分別對六個車型的近四個月銷售量進行預測的較優預測結果如表5。

表5:LSTM模型對六個車型近四個月預測結果的MAPE表

五、基于SARIMA模型的汽車銷量模型的構建

對于已經處理好的六個純電新能源車型的歷史銷量數據很容易建立相應的預測模型,本文構建的基于SARIMA模型的汽車銷量模型的模型圖如下,其主要步驟為SARIMA模型的訓練和預測結果的分析,如圖6所示。

圖6:基于SARIMA的汽車銷量預測模型

(一)數據處理

在構建SARIMA模型之前,最重要的就是檢驗數據是否平穩且是否為白噪聲[14]。該步驟決定了處理的數據是否可以進行SARIMA模型的構建。對每個車型的銷售數據進行單位根檢驗和純隨機數檢驗,將數據均轉換為平穩序列且非隨機數序列,各車型銷量數據的檢驗結果如表6。為簡化表格,將六種車型 “云度π1”、“小鵬汽車G3”、“蔚來汽車ES8”、“比亞迪唐EV”、“廣汽埃安Aion S”、“蔚來汽車ES6”依次編為車型一到六。

表6:不同車型銷量數據的檢驗結果表

(二)模式識別

建模需要的平穩非隨機數據處理好之后的重要步驟就是確定模型的滯后期。主要有兩種方法,圖示法和數值法。本文選擇的方法就是直接通過數值法來確定模型的滯后期,去除主觀因素對實驗準確度對實驗造成的影響。通過循環p、q值的大小,通過信息準則找出最優模型組合。

(三)預測

確定了每個車型的最優模型之后,本文用每個車型的最優模型對最近四個月進行預測,求出每個月的MAPE來查看模型對該月銷售量的預測精度的好壞,如表7所示,可以看出模型對總體的預測水平比較好,MAPE水平都比較低除了個別車型的個別月份的擬合效果不太理想。該模型對云度π1、蔚來汽車ES8和廣汽埃安Aion S這三種車型的預測精度較高,對于其他的的車型的預測對于真實值的損失比較大。

表7:SARIMA模型對六個車型近四個月預測結果的MAPE表

六、遷移學習

綜合上述實驗,對各個車型單獨建模形成的模型都大不相同,并且不能推廣到一般情況。所以,在上述實驗的基礎上,結合遷移學習的思想,本文提出一個基于遷移學習的LSTM模型[15],模型圖如圖7所示,其主要步驟為數據處理、泛化模型的構建、特化模型的訓練和預測結果分析。

圖7:基于遷移學習的LSTM汽車銷量預測模型

(一)泛化模型的構建

遷移學習主要是指將已知的或易知的領域推廣到未知的或比較困難的領域的一種重要的學習思想[15]。目前應用的場景很多,例如在機器學習領域,多數學者在實際研究過程中會把一些已知的模型推廣應用于不能或者難于構建模型的問題[16]。

本文將全部車型的數據集連接進行第一次訓練,通過LSTM的模型構建方法,設置初始模型,帶入數據集進行參數的一系列調整和訓練,最終確定了最優的LSTM模型為單層模型,基礎序列長度為19月,預測下 1月,輸入層 8節點,batch_size為256,epochs為150次,訓練出來的最終預測結果:MAE:0.043,MAPE:0.313。預測值與真實值構成的散點圖如圖8。

圖8:全部車型LSTM模型的預測值與真實值散點圖

(二)特化模型的訓練及預測

接著將上述模型保存,再分別對每個車型的銷量數據進行單獨訓練優化,使模型可以對每個車型具有針對性。用經過再次優化后的模型對近四個月進行預測得表8。對照上述表5可知,使用遷移學習的LSTM模型和對每個車型分別建模的LSTM模型兩者的精度差別不大,但是遷移學習的LSTM模型更具有廣泛性,可以對其他數據量較小的新純電新能源汽車的銷售量進行預測。

表8:LSTM遷移模型對六個車型近四個月預測結果的MAPE表

七、模型的對比與應用

(一)模型的對比

本文通過對消費者的購車行為進行分析,提出了基于LSTM模型、基于SARIMA模型和基于遷移學習的LSTM的三種汽車銷量預測模型,經過一系列調整與訓練,將三模型最優的MAPE進行比較得表9。從表中可以看出六個車型用三種模型進行預測的精度相差不大,分車型的LSTM模型和遷移學習的LSTM模型兩模型的預測精度差別也相近,除了小鵬汽車G3一種車型的MAPE差值達到60%,其余的幾種車型在兩種模型中的MAPE波動在10%~20%之間,屬于正常范圍。

表9:三種模型預測結果的MAPE表

對比上述三個模型對近四個月的預測結果的MAPE均值表10如下。在總體的汽車銷量預測上SARIMA模型比LSTM模型較好,但差距并不大。對比使用遷移學習的LSTM模型進行預測的結果精度與單獨對每個車型用LSTM模型進行預測的結果精度,兩者的精度相近,無差別,說明在電動新能源汽車的這幾個車型中,它們的數據結構具有一定的相似性,對于歷史數據的波動也具有一定的相關性。但在上述實驗中,三個模型對小鵬汽車G3 2022年2月的預測精度都發生了突變,考慮到其他的可能因素,本文將該車型去除重新計算均值發現三種模型的預測精度都差不多,同表10。

表10:三種模型預測誤差表

所以,通過該實驗為新能源汽車的銷量預測提供了一個可靠的模型。在對新能源汽車銷售數據進行預測,當車型的數據有所缺失或數據量較小時可以用相類似的新能源汽車進行訓練建模,再對該車型進行建模預測,同樣可以得到高精度的預測結果。

(二)應用

本文應用遷移學習模型對近來占據新能源汽車銷售榜頭的車型 “五菱宏光MINIEV”的銷量進行建模預測。其歷史銷售數據截至2022年3月止只有21條,數據量不足兩年,用常規建模方法很難對其進行精準預測。對比常規的LSTM模型和用遷移學習的LSTM模型的預測結果得表 11。發現遷移學習的LSTM模型有較好的預測精度,且MAPE值比較穩定,而用常規的LSTM模型對其進行預測,MAPE值不穩定。

表11:兩種模型對五菱宏光MINIEV預測的MAPE均值對比表

八、結語

本文對純電新能源汽車的銷量預測提出了三種模型,針對每個車型的LSTM模型和SARIMA模型和基于遷移學習的LSTM模型。前兩個模型對于不同的車型,兩模型預測結果的好壞不一致,不能確定哪個模型更優,且兩模型都過特殊只能對單個車型進行精準預測;而第三種基于遷移學習的LSTM模型具有泛用性可以對大部分純電新能源汽車進行銷量預測,且其預測結果與對車型單獨進行預測的結果的MAPE值并無差別,根據表10的 MAPE值可知,遷移學習的 LSTM模型的MAPE值為0.26,精度達到74%。

本文雖然提出了遷移學習的汽車銷量預測模型,對汽車銷量預測的研究有一定的作用,但對于本次實驗仍有很多不足:一是由于實驗設備算力有限,并不能將所有的所涉及到的所有參數進行統一調整,未進行更多參數的選擇進而改進模型;二是本文并沒有將更多的因素,如:政策因素、疫情因素、網絡搜索數據、網絡評論情感等包含到模型預測當中。

猜你喜歡
汽車銷量銷量新能源
丹麥去年酒類銷量增長近8%
4月汽車銷量225.2萬輛同比增長8.6%
7月汽車銷量211.2萬輛 同比增長16.4%
6月汽車銷量230萬輛 同比增長11.6%
4月汽車銷量207萬輛 同比增長4.4%
3月汽車銷量143萬輛 同比下降43.3%
2018年12月與上月相比汽車產量略降銷量小幅增長
2016車市銷量一覽表
買不買新能源汽車
綠色新能源
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合