?

基于負二項稀疏算子和推廣的負二項稀疏算子的INAR(1)模型的比較

2024-03-16 10:11趙宸稷張慶春曹曉涵
科學技術創新 2024年6期
關鍵詞:新息真值樣本量

趙宸稷,張慶春,曹曉涵

(1.吉林化工學院 信息與控制工程學院,吉林 吉林;2 吉林化工學院 理學院,吉林 吉林)

近幾十年來,整數值時間序列的建模問題受到學者廣泛關注,基于稀疏算子構建整數值模型是研究整數值時間序列的主要方法。其中基于二項稀疏算子的整值INAR(1)模型[1]是最為經典的模型。例如近年來,基于二項稀疏算子利用預設邊際分布法,Nasti'c 等2016 年基于二項稀疏算子建立的一元一階整數值自回歸模型[2],Popovi'c 等2016 年建立了具有相同幾何邊際分布的二元INAR(1)模型[3]等。為了刻畫傳染病過程、繁殖過程和犯罪過程等具有活躍的數據生成機制,Risti'c 提出了負二項稀疏算子[4],很多學者基于負二項稀疏算子建立了INAR(1)模型,例如利用預設邊際分布法,Barreto-Souza 和Bourguignon 在2015 年基于修正的負二項稀疏算子考慮了以Laplace 分布為邊際分布的INAR(1)過程[5]。但由于自身定義的原因,負二項稀疏算子不適合利用預設新息過程的分布法構建INAR(1)模型,張等(2020)提出了一個推廣的負二項稀疏算子并基于該稀疏算子利用預設新息過程的分布法建立了二元INAR(1)模型[6]?;谕茝V的負二項稀疏算子利用預設邊際分布法,Aleksi'c MS 和Risti'c MM 在2020 年提出了一個幾何修正整數值自回歸模型[7]。這表明推廣的負二項稀疏算子在利用預設新息過程分布的方法構建INAR(1)模型是非常重要的。文獻[6]中已經指出利用預設新息分布法基于負二項稀疏算子的INAR(1)模型(NBINAR(1))在x=0 點時概率質量不存在從而其所有邊際分布不存在,從而NBINAR(1)模型不存在。本文將從數值模擬的角度,通過假定該模型的一步轉移概率是存在的,利用條件極大似然方法對該模型的參數進行廣泛地模擬研究,并將該模型的估計結果與利用預設新息分布法基于推廣的負二項稀疏算子構建的INAR(1)模型(ENBINAR(1))的結果相對比,來進一步說明NBINAR(1)模型不存在的原因。進而表明推廣的負二項稀疏算子在利用預設新息項分布法構建INAR(1)模型時的必要性。

1 模型的定義

1.1 ENBINAR(1)模型

把滿足迭代方程(1)的過程稱為基于推廣的負二項稀疏算子的INAR(1)過程:

記作ENBINAR(1)過程。其中“*E”表示推廣的負二項稀疏算子,其定義如下:

在(2)式中X 表示非負整數值隨機變量,參數α 滿足α∈(0,1),Wj相互獨立且服從參數為α 的幾何分布,其分布律為εt為新息項。

1.2 NBINAR(1)模型

把滿足迭代方程(3)的過程稱為基于負二項稀疏算子的INAR(1)過程記作NBINAR(1)過程。

其中“*”表示負二項稀疏算子,其定義如下:

同樣的,在式(4)中X 表示非負整數值隨機變量;參數α 滿足α∈(0,1),Yi相互獨立且服從參數為α的幾何分布,其分布律為εt為新息項。

注意到,ENBINAR(1)模型和NBINAR(1)模型區別在于:ENBINAR(1)模型中Wj是從1 取到x+1,而在NBINAR(1)模型中Wj是從1 取到x。

2 參數估計

ENBINAR(1)模型和NBINAR(1)模型的一步轉移概率形式上都可以表示為:

其中,f2(k)為新息過程的密度函數,在ENBINAR(1)模型中在NBINAR(1)模型中

因此兩個模型的條件似然函數形式都表示為

其中θ 是未知參數向量,θ 的條件極大似然估計可通過最大化下面的條件對數似然函數得到

3 模擬研究

本節中,我們通過一系列的數值模擬來比較極大似然估計(CML)在評估兩個模型NBINAR(1)模型和ENBINAR(1)模型中的效果。將兩個模型的新息項分布分別取作泊松分布和幾何分布。

(1) 當新息項取泊松分布時,式(5)中的f2(k)形式為:

(2) 當新息項取幾何分布時,式(5)中的f2(k)形式為:

模擬研究的樣本量分別取100,300 和500,所有的模擬研究都是在R 軟件環境下基于1 000 次的重復計算的結果,以下是兩個模型NBINAR(1)模型和ENBINAR(1)模型基于CML 估計的均值(Mean)和均方誤差(MSE) 以及標準誤差(SE) 的對比。注意到,在NBINAR(1)模型中,為了估計的順利進行,原本當xt-1為0 時,其一步轉移概率中f1(xt-k)的前半部分,即沒有定義,但為了模型的運行,本文將其設定為1。

從表1、表2 兩個模型模擬的數據結果對比可以看出,隨著樣本量的增大,兩個模型的Mean 值會越來越趨近于真值,但ENBINAR(1)模型趨近于真值的速度更快;對于兩個模型的MSE 和SE 也越來越小,注意到,當λ 很小,靠近于1 時,ENBINAR(1)模型的MSE 和SE 更小,說明兩個模型當λ 大于1 時,兩個極大似然估計量都具有漸近性。但當λ 逐漸靠近1時,ENBINAR (1) 模型極大似然估計量的估計效果更好。值得注意的是,當λ 大于0 小于1 時,NBINAR(1)模型的估計值和真值差距非常大,尤其是λ,其估計值比真值小好多數量級,經四舍五入后均為0。但ENBINAR(1)模型的估計效果很好,且估計量具有漸近性。分析NBINAR(1)模型在λ 大于0 小于1 估計的效果很差的原因為數據中0 出現的次數過多,例如當α=0.1,λ=0.3,樣本量為100 時,數據中里面為0 的個數為87 個,數據里面為0 的概率達到了87%。當λ 大于1 時,隨著λ 增大,數據里面0 出現的個數越來越少,兩個模型的Mean,MSE 和SE 的差距越來越小。因此,從模擬結果可以清晰看出NBINAR(1)模型中當出現0 的個數過多時,會影響其參數估計的結果和效果。更進一步的說明不能忽視x=0 的邊際分布不存在進而整個NBINAR(1)模型的邊際分布不存在的事實,因此,模擬結果更直觀地說明了基于利用預設新息分布法基于負二項稀疏算子構建的INAR(1)模型是不存在的。

表1 新息項為泊松分布時,兩個模型的Mean,MSE,SE 的對比

表2 新息項為幾何分布時,兩個模型的Mean,MSE,SE 的對比

4 結論

本文通過對利用預設新息分布法分別基于負二項稀疏算子和推廣的負二項稀疏算子建立的INAR(1)模型進行極大似然估計并進行數值模擬研究,模擬結果表明:當兩個模型的新息項分別取泊松分布或者幾何分布時,λ 大于1 時,兩個模型的Mean 隨著樣本量的增加而趨近于真值,且MSE 越來越小,而基于推廣的負二項稀疏算子的INAR(1)模型的Mean 趨近于真值的速度更快,且SE 和MSE 要比基于負二項稀疏算子的INAR(1)模型的要更小。值得注意的是,當λ大于0 小于1 時,NBINAR(1)模型中由于零出現的次數偏高,導致其估計值和真值差距很大,但ENBINAR(1)模型的估計效果很好。這再次驗證了不能忽視基于負二項稀疏算子的INAR(1)模型在x=0 點時概率質量不存在的事實,直觀地說明基于負二項稀疏算子的INAR(1)模型不存在,也進一步闡明了推廣的負二項稀疏算子對于構建INAR(1)模型的重要性和必要性。

猜你喜歡
新息真值樣本量
醫學研究中樣本量的選擇
傳遞函數辨識(21):線性回歸系統的遞階遞推參數估計
航空裝備測試性試驗樣本量確定方法
M估計的強跟蹤SVD-UKF算法在組合導航中的應用
Sample Size Calculations for Comparing Groups with Binary Outcomes
10kV組合互感器誤差偏真值原因分析
自適應卡爾曼濾波在航空重力異常解算的應用研究
基于新息正交性自適應濾波的慣性/地磁組合導航方法
真值限定的語言真值直覺模糊推理
基于真值發現的沖突數據源質量評價算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合