?

兩主兩從博弈下的裝備維修器材供應鏈協調研究

2017-06-15 13:40
兵器裝備工程學報 2017年5期
關鍵詞:主從獎金器材

林 翔

(海軍裝備研究院,北京 100161)

【后勤保障與裝備管理】

兩主兩從博弈下的裝備維修器材供應鏈協調研究

林 翔

(海軍裝備研究院,北京 100161)

以相互競爭的兩條裝備維修器材供應鏈作為研究背景,提出了一種基于Stackelberg主從博弈的激勵協調模型,并通過最優反應動態思想給出求解該模型的一般思路,結合粒子群優化算法對軍事算例進行仿真,對比分析供應商合作與非合作下的計算結果,供應商非合作下獎金激勵策略可以有效實現供應鏈協調,但供應商若能實現合作,將使供應商達到利益最優化,可忽略獎金激勵的影響。

裝備維修器材;Stackelberg主從博弈;供應鏈;最優反應動態;粒子群優化算法

在市場經濟條件下,部隊作為裝備維修器材供應商的最終消費者,其偏好決定了供應商的收益。在供應器材品質相當的情況下,維修單位作為部隊與供應商的中間環節,其服務水平是引導部隊消費的重要環節。因此,供應商需要提供一定的激勵機制提高維修單位的服務水平。

文獻[1]給出了當前裝備維修器材供應鏈的一個基本現狀以及未來的發展趨勢;文獻[2]描述了在隨機性需求、需求對服務水平敏感條件下,生產商如何通過激勵機制使分銷商保持較高庫存的庫存決策問題。文獻[3]在假設一個供應商、一個分銷商且市場需求確定的情況下,討論了供應商能夠提供幾類契約以及對供應鏈相應的影響。文獻[4]討論了在兩個供應商對兩個分銷商情況下,價格促銷對市場需求變化的作用。不足的是,市場需求不僅與商品價格、品質有關,同時也與分銷商服務水平相關。文獻[5]研究了兩個分銷系統(每個分銷系統具有一個作為主方的生產商和一個作為從方的分銷商)發生相互競爭的問題。文獻[6-8]提出了一種求解雙矩陣對策多重納什均衡解的粒子群優化算法,并通過仿真示例驗證了其有效性。

在上述文獻的基礎上,結合當前裝備維修器材供應實際,給出了兩條裝備維修器材供應鏈在Stackelberg博弈下的協調訂貨問題,并在此基礎上建立優化模型,構建適應度函數,利用粒子群優化算法求解,并運用實際算例進行了仿真計算,對兩主方合作與非合作的情況進行了對比分析,得出了一些可以解釋現實中出現的經濟狀況的結論。

1 問題描述

對同一類武器裝備,往往有多個維修單位對同一軍事片區進行維修保障,同時,這些維修單位又分別有自己的裝備維修器材供應商,供應商要想將自己的裝備維修器材盡量多的供應給部隊并從中獲取收益,就需要所供應的維修單位盡量多的接手到相應的維修任務,消耗掉裝備維修器材,從而有新的訂單來為供應商獲取利潤。

同一軍事片區內的部隊,在遇到武器裝備故障問題時,會綜合考慮維修費用、維修品質和維修服務態度等因素決定維修單位,其中的維修服務態度是變數最大的,與維修單位對每個維修任務的重視程度有直接關系,包括說明故障問題、糾正使用方法、定期派人維修保養等。因此,供應商為了讓維修單位提供盡可能讓部隊滿意的維修服務態度,建立激勵機制[9]鼓勵維修單位改善服務態度,提高維修單位認可度,獲得在承受范圍內更多的維修任務。

2 建立激勵協調模型

2.1 模型假設與分析

本文通過分析同一軍事片區內的兩條裝備維修器材供應鏈分析上述問題,假設某艦艇支隊的維修保障任務都可由這兩個維修單位負責。供應商根據維修單位一個周期內所用的裝備維修器材數量提供獎金,用σ表示單位數量的獎勵,而維修單位則通過提高服務水平爭取盡量多的維修任務,獲取獎金。顯然,服務水平的提高需要維修單位付出相當程度的努力,這里用η表示維修單位的努力程度。

面對同一軍事片區內有限的維修任務,兩個維修單位之間就會產生競爭關系,維修單位B1在確定自己的努力程度時,不僅要考慮供應商提供的獎金,還要考慮維修單位B2的努力程度。因為一方的努力程度明顯高于另一方,就會出現大部分維修任務被一方占據的情況。若維修單位B2的努力程度越高,其維修任務自然會更多,此時供應商A1在制訂激勵策略時不僅要考慮維修單位B1,還需要把維修單位B2的努力程度考慮在內,并進一步考慮供應商A2的激勵策略。同樣地,維修單位B2和供應商A2也面臨同樣的策略問題。這兩條裝備維修器材供應鏈相互影響的示意圖如圖1。

圖1 兩裝備維修器材供應鏈相互競爭示意圖

顯然維修單位Bi(i=1,2)的努力程度ηi(0≤ηi≤100%)需要付出相應的努力成本Ci,并且努力成本Ci是努力程度ηi的嚴格增函數,隨著ηi的遞增,Ci遞增速度更快,即Ci′(ηi) > 0,C″i(ηi) > 0,該成本函數可以用公式表示[10]:

(1)

其中ci是一個定值。

維修單位一個周期內所獲的維修任務可以通過這一個周期所使用的裝備維修器材數量Γ來體現,在此假設部隊選擇維修單位時對服務水平相當敏感,維修費用影響不大,且維修單位的維修品質都很平均??梢缘贸?,器材使用函數Γ與維修單位的努力程度密切相關,不僅與自己的努力程度有關,也與另一個維修單位的努力程度有關。當對手的努力程度不變時,自己的努力程度越大,就能爭取到可能原本屬于對手的維修任務,維修任務多了,裝備維修器材使用數量自然也就越大,可以用下式表達其含義:

(2)

其中i,j∈{1,2}且i≠j,αi為自身努力程度對裝備維修器材使用數量的產出系數,β為努力程度差值對裝備維修器材使用數量的轉移系數,即當ηi>ηj時,維修單位Bj的裝備維修器材使用數量β(ηi-ηj)轉移給維修單位Bi,當ηj>ηi時,情況剛好相反。

為簡化模型,將維修單位使用的裝備維修器材數量作為供應商可以得到收益的裝備維修器材銷售數量。并且不考慮各成本與收益之間的復雜關系,只關心獎金激勵與努力程度對兩條裝備維修器材供應鏈中供應商和維修單位的影響。

可以得出供應商Ai的總收益為

(3)

維修單位Bi的總收益為

(4)

其中ai為供應商Ai的單位裝備維修器材銷售利潤,bi為維修單位Bi使用單位裝備維修器材的維修收益。

2.2 Stackelberg主從博弈問題

根據上述分析,這兩條相互影響的裝備維修器材供應鏈構成了兩主兩從的Stackelberg主從博弈問題,其中主方是供應商A1、A2,策略就是獎金激勵策略;從方是維修單位B1、B2,用努力程度響應。用U和V分別表示主方和從方的策略集,獎金激勵策略σ1、σ2表示主方A1、A2的策略,努力程度η1、η2表示從方B1、B2的策略,即σ1,σ2∈U,η1,η2∈V。

兩個主方、兩個從方作為獨立的利益主體,都希望達到利益最大化,所以供應商Ai的策略函數為

(5)

維修單位Bi的響應函數為

(6)

式(5)(6)所得的決策對({σ1,η1},{σ2,η2})就是上述兩主兩從Stackelberg主從博弈問題的均衡解。

2.3 優化模型

顯然,供應商作為純粹的利益組織,其目的就是為了獲取更高的利益,所提供的獎勵不可能高于銷售利潤,即

(7)

為簡化問題,假設兩供應商相互合作,上述兩主兩從的Stackelberg主從博弈問題實際就變成了一主兩從的Stackelberg問題。以兩供應商總收益最大化為目標,通過兩從方之間努力程度的相互制約來建立約束關系,可以得到一主兩從的Stackelberg模型如下:

(8)

而對兩主方完全非合作的兩主兩從Stackelberg主從博弈問題,需要分別以兩供應商收益最大化為目標,建立多目標優化模型如下:

(9)

(10)

該模型是一個多目標非線性約束問題,本文利用進化博弈論的最優反應動態思想(Best response Dynamics)[11-12]與粒子群優化算法,對上述兩主兩從的Stackelberg主從博弈問題進行求解。

3 算法設計

通過文獻[11-12],可以知道利用最優反應動態思想,可以很好地模擬有限理性人的行為,在競爭者進行策略迭代時逼近Stackelberg主從博弈的均衡解。在兩主兩從Stackelberg主從博弈問題中,兩主方是通過兩從方的競爭策略來進行相互博弈,主方與從方構成一個上下層關系,之間的博弈為Stackelberg博弈,而下層兩個從方之間的博弈為Nash博弈。

求解兩主兩從Stackelberg主從博弈模型,實質上是對從方相同的兩個一主兩從模型進行求解,其求解過程如下:

步驟1 初始化上層(主方)策略σ;

步驟2 下層(兩從方)根據各自目標函數最大化進行多目標優化問題求解,得到一個Nash均衡解,作為下層(兩從方)的策略{η1,η2};

步驟3 利用粒子群優化算法,以上下兩層即主從雙方的策略代表粒子,進行一主一從下的Stackelberg主從博弈模型求解。

利用上述過程可以求出兩主方合作下的均衡解,需要注意的是,供應商在由非合作轉換成合作的過程中,應具備一個基本的觸發條件,即保證供應商在非合作下的利益低于合作后的利益。因此,為維持合作的穩定性,需要制訂一個合作方均能認可的利益分配方案,本文采用的是核和Shapley值的利益分配方案[13]。

假設Stackelberg博弈中的兩從方是完全理性的,其決策是同時進行的,并假設主方是有限理性的,以保證主方提出策略后,從方能迅速給出依據主方策略的均衡解。下面給出采用進化博弈論中的最優反應動態思想求解兩主兩從Stackelberg問題的算法步驟:

步驟1 初始化供應商A1、A2給維修單位的單位數量獎金策略σ1、σ2。

步驟2 給出主方A1、A2之間的行動順序,同時設定決策的最大迭代次數kmax,記k=0。對于主方行動順序有先后的情況,轉到步驟3,對于同時行動的情況,轉到步驟4。

步驟3 利用一主兩從Stackelberg問題的求解思路,在每輪決策中,主方Ai根據Aj的策略,考慮從方B1、B2的反應,做出新的策略來替換原策略,而主方Aj決策時,再根據主方Ai新策略下從方B1、B2的反應來制定其新策略,替代原策略,這樣迭代次數才算完成一次,即k=k+1。

步驟4 利用一主兩從Stackelberg問題的求解思路,在每輪決策中,主方Ai(i=1,2)決策時,根據另一主方的策略,考慮從方B1、B2的反應,制定新的策略。當主方A1、A2都決策完畢了,再用兩個新策略來替換原策略,這樣本輪決策完畢,迭代次數加1,即k=k+1。

步驟5 對于主方行動順序有先后的情況,重復步驟3,而對于主方同時行動的情況,重復步驟4。直到兩個主方該輪決策結果與上一輪的相同(或兩者之間的范數小于給定值),則達到Stackelberg均衡,算法結束?;蛘呤钱數螖祂=kmax時,算法終止。

4 軍事算例仿真與分析

在某一軍事片區中有兩個維修品質和維修水平相當的維修單位B1、B2,他們各自都有自己的器材供應商,其中供應商A1負責維修單位B1,供應商A2負責維修單位B2,兩維修單位處于獨立非合作關系。兩維修單位全面負責該軍事片區中聯軸節等這類裝備維修器材的保障維修任務,因為聯軸節等這類器材耗損率高,耗損速度快,報修周期短,故該軍事片區中的部隊用戶對維修單位的維修服務水平較為敏感,該軍事算例的基本參數設置如表1所示。

表1 有關參數

初始化主方的策略σ1=σ2=0,即兩個供應商剛開始都不給維修單位提供獎金激勵,在此初始條件下,利用最優動態反應思想與粒子群優化算法對兩供應商合作與非合作下的Stackelberg主從博弈模型進行求解,其中取粒子群規模N=20,參數設定ωmax=0.9,ωmin=0.4,最大迭代次數kmax=50。仿真計算實現采用的操作系統為Windows XP,機器硬件CPU為Pentium Dual-Core 3.0 GHz,2 GB內存,用Matlab 7.1編程計算,計算時間不超出3 s。所得結果如表2所示。

表2 合作與非合作下求解結果對照

其中,在供應商非合作決策下,A1先決策A2后決策、A2先決策A1后決策以及二者同時決策3種情況求解得到的Stackelberg均衡解都是

(11)

當A1、A2不同時決策時,求解到第2輪迭代后就已經接近Stackelberg均衡解,而A1、A2同時決策時,要到第3輪迭代結束才接近均衡解,這說明多個主方決策順序是否相同與最后求得均衡解的速度有一定關系。

觀察表2可以得出以下結論:

1) 在供應商合作的情況下,供應商不會提出獎金激勵。

2) 在供應商非合作的情況下,供應商會提出獎金激勵以提高維修單位努力程度。

3) 供應商非合作下,維修單位的收益要高于合作下的收益,表明維修單位可以在供應商非合作中漁利。

4) 供應商在合作下的總收益要高于非合作下的總收益,且當6 981≤t≤7 726時,各供應商合作后的收益均大于非合作下的收益,故供應商有發起合作的基本動機,并在t=7 354時達到Shapley值。但具體利益分配方案會受到合作行為、公平性要求以及其他非理性情感因素的影響,要綜合考慮Shapley值進行談判決定。

5) 供應商在非合作下提出獎金激勵能使維修單位收益增加,似乎犧牲了自己的利益,因為在供應商合作下,即使不給維修單位提供獎金激勵,供應商的利益也比非合作下的高??上У氖铅?=σ2=0并不是Nash均衡,還需要兩個主方的共同協作來達成。這也正好與當今市場下主導者時常提出獎金激勵制度的現狀相吻合,原因就在于市場中主導者進行合作時要達到Nash均衡非常困難。

5 結束語

本文以維修單位獨立非合作為前提,分析了同一軍事片區中同類武器裝備的兩條裝備維修器材供應鏈相互競爭的關系,提出了兩主兩從Stackelberg主從博弈問題,并建立相應的多目標優化模型。最后,應用進化博弈論中的最優動態反應思想結合粒子群優化算法給出兩主兩從Stackelberg問題的求解步驟,利用軍事算例進行仿真,對供應商合作與非合作下的結果進行分析,得出:在非合作下供應商實施獎金激勵策略可以實現供應鏈協調,而在合作下獎金激勵不再那么重要,關鍵在于如何實現供應商的合作共贏。

[1] 何海寧,舒正平.供應鏈環境下的裝備維修器材保障[J].物流科技,2006,136(29):66-69.

[2] RICARDO E,STEPHEN G P.Manufacturer Incentives to Improve Retail Service Levels[J].European Journal of Operational Research,1998,104(11):437-450.

[3] CORBETT C J,TANG C S.Designing Supply Contracts:Contract Type and Information Asymmetry[M].Chapter 9 in the Quantitative Models for Supply Chain Management,Boston,Kluwer:1999.

[4] LAI R,VILLAS-BOAS J M.Price Promotions and Trade Deals with Multi Product Retailer[J].Management Science.1998,44(7):935-9491.

[5] 田厚平,郭亞軍,劉長賢.分銷系統中的多主多從Stackelberg主從對策問題研究[J].管理工程學報,2005,19(4):74-78.

[6] 張榮沂.一種新的集群優化方法—粒子群優化算法[J].黑龍江工程學院學報,2004,18(4):34-37.

[7] 瞿勇,張建軍.多重納什均衡解的粒子群優化算法[J].運籌與管理,2010,19(2):52-55.

[8] 馬向陽,陳琦.以粒子群算法求解買賣雙方存貨主從對策[J].中國管理科學,2010,18:142-145.

[9] 羅定提,仲偉俊,張曉琪.分散式供應鏈中旁支付激勵機制的研究[J].系統工程學報,2001,16(3):236-240.

[10]張維迎.博弈論與信息經濟學[M].上海:三聯出版社,1996:182-186,190-197,200-207.

[11]謝識予.經濟博弈論[M].上海:復旦大學出版社,2002:268-273,244-245.

[12]盛昭瀚,蔣德鵬.演化經濟學[M].上海:三聯出版社,2002:13-17,281-285.

[13]LEOPOLD W U.Some Selected Topic in Experimental Economics[J].International Transactions in Operational Research,1997,4(3):165-174.

[14]林翔, 瞿勇. 基于主從博弈的裝備維修器材供應鏈協調訂貨[J].兵工自動化,2015(12):59-63.

[15]高鐵路,葉術青,高崎.基于價值的裝備維修器材保障風險研究[J].四川兵工學報,2015(11):70-73.

(責任編輯 唐定國)

Study on Supply Chain Coordination of Equipment Repair Equipment with Two Leaders-Followers Game

LIN Xiang

(Naval Academy of Armament, Beijing 100161, China)

Take the competitive two supply chain of equipment repair equipment as the research background, a kind of incentive coordination model based on the Stackelberg game is proposed, and the general idea of solving the model is given by using the best response dynamics theory. Through the application of the particle swarm optimization algorithm (PSO), the simulated results of the military example on the suppliers cooperation and non cooperation are analyzed to show that the incentive strategy under the non cooperation can effectively achieve the coordination of the supply chain, but if the suppliers to get the cooperation, it will enable the suppliers to achieve the best interests of the optimization and the bonus incentive is no longer the key.

equipment repair equipment; Stackelberg game; supply chain; best response dynamics; PSO algorithm

2016-12-21;

2017-01-16 作者簡介:林翔(1991—),男,碩士,助理工程師,主要從事軍事建模與系統決策研究。

10.11809/scbgxb2017.05.032

format:LIN Xiang.Study on Supply Chain Coordination of Equipment Repair Equipment with Two Leaders-Followers Game[J].Journal of Ordnance Equipment Engineering,2017(5):140-143.

O225

A

2096-2304(2017)05-0140-04

本文引用格式:林翔.兩主兩從博弈下的裝備維修器材供應鏈協調研究[J].兵器裝備工程學報,2017(5):140-143.

猜你喜歡
主從獎金器材
AV TOP 100!2020-2021年度優秀影音器材推薦榜簡評
Antarctica's pretty pink snow
Boy dresses up to honor school security officer
基于ACS880變頻器XD2D主從功能的采煤機牽引調速系統設計
最貴的器材多少錢 Damian Demolder
三國漫——獎金
給好好睡覺的員工發獎金
視聽器材個股表現
視聽器材個股表現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合