?

智能體視覺策略在Robo Cup中的設計*

2014-07-25 07:44丁晨陽
網絡安全與數據管理 2014年5期
關鍵詞:朝向視野物體

丁晨陽

(揚州市職業大學,江蘇 揚州 225009)

多智能體系統的研究是計算機科學和人工智能研究的重點。RoboCup機器人足球比賽是多智能體系統MAS(Multi-Agent System)和分布式人工智能的一個重要研究平臺[1]。

RoboCup仿真平臺中環境是不可知的,球員對于環境的認識主要來源于感知系統[2],感知系統包括視覺感知、聽覺感知和身體感知,這些信息由仿真服務器按規定的周期發送給球員。身體感知只能感知球員自身的信息,而聽覺感知非常有限且不可靠,因此視覺信息是最直接可靠、也是最多使用的信息獲取方式。在復雜多變的足球比賽中,球員需要依據當前場上的局勢進行最優的動作決策以及動作的精確執行,這就要求智能體必須以一種智能的方式合理調整視覺,準確、及時地跟蹤場上狀態的變化。

目前各個仿真球隊采用的視覺策略中,有讓球員始終朝向球看,方法簡單但卻直接、有效;有的策略則將智能體的多個觀察目標按照其可信值排序,如果可信值低于某個值,就提出觀察請求,這種方法保證所有觀察目標的平均可信值盡量高[3]。實際上當球員在比賽中面臨不同局勢時,想要觀察的目標是不同的,而且對不同目標的關心程度也是不同的。球員最希望獲得的是那些與其動作決策關系密切的場上信息,采用以上視覺策略會使球員無法全面、準確地掌握場上信息,從而導致動作決策的效率不高。

本文設計了一種基于優先級和可信值的視覺策略,通過綜合考慮觀察目標的可信值和優先級來調整球員的最佳視覺角度,優化球員視覺信息的獲取。

1 RoboCup中球員智能體的視覺

在RoboCup仿真環境里,球員有身體朝向和臉朝向兩個概念。身體朝向決定了每個球員dash(沖刺)的方向,即每個球員只能朝身體方向給自己加速。球員觀察的范圍主要由臉朝向決定,球員的視野是一個以臉朝向為中心,正負各1/2視野寬度的扇形。球員距離觀察目標越遠,看得越不清楚。視野寬度ViewWidth可以為45°(窄視角)、90°(普通視角)和 180°(寬視角)。每個球員在獲取視覺信息時都是用一種視野寬度的模式觀察,不同視野寬度帶來的觀察效果也不同,較窄的視野寬度所獲得信息的頻率較快。目前仿真環境規定45°視野寬度每0.75周期獲得一次視覺信息,90°視野寬度每 1.5周期獲得一次視覺信息,180°視野寬度每3個周期獲得一次視覺信息[4]。

通過調整視野寬度、身體朝向以及臉朝向可以獲取更多的視覺信息。球員可以通過change_view指令改變視野寬度,turn指令改變身體朝向,turn_neck指令轉動臉朝向和身體朝向之間的夾角。但是turn指令與dash、kick等指令互斥,不能在同一周期發送,否則會與其他決策模塊產生沖突。turn_neck指令則可以和dash、kick、turn等動作在同一個仿真周期內執行,球員的面朝向和身體朝向最多成90°角,在不轉身的情況下球員理論上可以觀察到的最大角度為:

觀察到的最大角度=視野寬度/2+90° (1)

因此,球員的視覺決策一般放在所有動作決策模塊之后執行,并且要對產生的決策效果做預測,預測后續周期需要的信息,然后根據需求計算出最終實際要轉動脖子的角度,調整角度,使下個視覺信息到來時視野能覆蓋觀察目標。

2 視覺策略的設計

比賽中在一個仿真周期內球員想要觀察的目標往往不是唯一的,球和其他隊友或敵人都有可能成為被觀察的目標,如圖1所示,球員A控球,球員 B和C為隊友,球員 P為敵方隊員,若 A考慮傳球,則 B、C和 P可能做出截球動作,球員A首先需要觀察一下球員B、C和P,以判斷隊友是否能夠截到球,再做出決策是否應該執行該動作。所以最終視覺角度的確定需要一定的設計,對每一個可能的視角,可以使用一個評價值進行評價,考慮到場上形勢和決策的需要,在計算評價值時應該綜合考慮各個被觀察對象的優先級和可信值,才能兼顧處理多個觀察請求,獲得較優視覺信息。

圖1 球員A及其周圍局部環境

2.1 目標優先級

球員根據對各個觀察目標的不同需求程度,設定優先級priority。對于球員的n個觀察目標 (0<n≤23),設定的優先級分別為pi(i=1,2,…,n)。 以觀察球員為中心,指向對方半場的方向為0角度,則被觀察物體相對球員的角度分別為 θi(i=1,2,…,n),θi∈[-180,180]。

觀察目標分為三個部分:球、動態對象和固定對象。球是隊員必須經常觀察的對象,對球的信息不準確,就談不上做各種決策,因此球的優先級是最高的。動態對象由上層決策模塊決定,比如當球員控球時,就把場上可以傳球的隊友加入到觀察請求中,并把離球員最近的敵方隊員加入觀察請求。動態對象的優先級可根據場上情況做適當調整,對于可傳球隊友,傳球成功率越高,優先級越高。固定對象是預先規定好的,它包括某些在大部分時刻都必須觀察的對象,如離球員最近的隊友。進入對方半場時還要把對方的守門員加進來。固定對象的優先級是確定的。當固定對象與動態對象重疊時,觀察請求不進行重復添加,優先級以動態對象為準。

球員智能體的多個觀察請求用C++STL的map模板進行保存,定義如下:

MVisualReqQueue的每個元素是一個二元組<對象,優先級>,描述了從對象到其當前的優先級之間的映射。

2.2 目標可信值

RoboCup中,由于球員智能體每一次獲得的視覺信息十分有限且含有噪聲,因此在對這些數據的加工和對世界模型的維護過程中,需要引入記憶模型[5]。記憶模型一方面負責保存環境物體的歷史信息,另一方面通過一個可信值(confidence)來描述目標信息的準確程度,它的取值范圍是[0,1],每一個仿真周期目標的可信值更新如下:

其中,conf_decay=1-(tc-to)/100。 一般地,取 see_conf=1.0,tc為當前時間,to是目標上次被看到的時間。

2.3 最佳視覺角度的確定

視覺策略最終要解決的是確定球員的視野平分線(用其與對方半場方向之間的夾角α表示,α∈[-180,180]),使球員獲得較優的視覺信息。假設球員某一確定視野中包含若干物體,優先級分別為pi,…,pj,可信值分別為 confi,…,confj。本設計采用式(2),優先級和可信值之比的平方和開根號來計算某個視覺角度的評價值。

這種算法是優先級高,可信值低的物體在最終結果中占的比重大些,既有利于選出觀察優先級高的對象,又對可信值低的對象加以重視。顯然,當視野中覆蓋的物體越多,對這些物體的優先級越高,物體的可信值越低,則該視野所觀察到的有用信息就越多,其評價值也越大。

進行最佳角度搜索的時候將要觀察的目標置于球員視野的右邊界,然后搜索請求觀察的每一個物體。搜索過程用偽碼描述如下:

球員首先把第一個觀察目標置于視野的右邊界,根據參數ViewWidth確定觀察視野,然后搜索上層決策模塊請求需要觀察的所有物體。如果某物體在視野的覆蓋范圍內,則把它的優先級和可信值加入到該視覺角度的評價值計算中,并將該觀察目標相對球員的角度存入γ,否則不做任何處理,繼續搜索。搜索完所有物體后,該視覺角度的評價值將包含所有被視野覆蓋的物體的優先級和可信值,同時β最后保存的是處于視野另一邊界的物體相對于球員的角度。這時可以將視覺角度按照式(3)進行調整,使得觀察方向位于左右兩個邊界物體的角平分線上。然后再對第二個物體進行相同的操作,直到對所有觀察目標搜索完畢。

這樣的搜索完畢后,就確定了最優的視覺角度αs。

確定好最佳視覺角度后,即可通過turn_neck指令調整球員視角,以獲得期望的信息。

此外,根據比賽規則,由于球員每周期只能執行一個動作,所以過于頻繁的獲取信息也沒有意義,在本策略中的視野寬度 ViewWidth采用 90°-45°-45°的方案,這樣獲取視覺信息的周期依次是0-1.5周期-2.25周期-3周期,這樣以3周期為一次循環單位不斷循環,可以保證每周期都可以獲得視覺信息,同時又可獲得較大的視野范圍。

3 仿真實驗結果

為測試本文視覺策略的有效性,先后對采用和不采用本視覺策略的球隊作了長時間測試,為減少比賽隨機性對結果的影響,取同一支球隊作為對抗球隊,表1給出統計的對比數據。從表1可以看出,采用改進的視覺策略后,我方平均控球率提高了8.6個百分點,進球機會增加了。

表1 控球率對比表

采用本文設計的視覺策略和未采用該視覺策略的傳球成功率的對比曲線如圖2所示,可以看出,采用本視覺策略后,球隊傳球成功率有所提高,有效增強了球員之間協作的力度。

圖2 傳球成功率對比曲線

RoboCup仿真比賽的環境是復雜多變的,球員智能體需要依據當前場上的形勢進行決策,信息的準確獲取是智能體動作決策和執行的前提,智能體應能以一種高效的方式合理調整視覺才能保證準確地跟蹤場上狀態的變化。本文對球員的視覺策略進行了設計,根據動作決策的需要,考慮球員當前觀察目標的優先級,結合它們的可信值,計算出各個視覺角度的評價值,最后通過搜索比較確定一個最佳的視覺角度,為多智能體的團隊協作提供了全面、準確而及時的信息。

將本文提出的視覺策略應用在RoboCup仿真球隊后,球隊的平均控球率提高了8.6%,球員之間的傳球成功率有所提高,說明新的視覺策略為智能體間的協作提供了較為可靠的信息,對增強球隊整體性能具有一定效果。

[1]李實,徐旭明,葉榛,等.機器人足球仿真比賽的 Server模型[J].系統仿真學報,2000,12(2):138-141.

[2]郭定明,張樹林,李璞.淺談 RoboCup中的感知系統及相關決策[A].2004中國機器人足球比賽暨研討會論文集[C].廣州:中國自動化學會機器人競賽工作委員會,2004:15-18.

[3] REIS L P, LAU N.FC PortugalTeam Description:RoboCup 2000 Simulation League Champion[J].Springer Verlag Lecture Notes in Artificial Intelligence, 2001(2019):175-197.

[4]CHEN M, FOROUGHI E, HENITZ F, et al.RoboCup Soccer Server Manual for Soccer Server Version 7.07[EB/OL].http://sserver.sourceforge.net/.2003.

[5]DE BOER R,KOK J.The Incremental Development of a SyntheticMulti-AgentSystem: TheUvA Trilearn 2001 Robotic Soccer Simulation Team[D].University of Amsterdam,2002.

猜你喜歡
朝向視野物體
朝向馬頭的方向
朝向馬頭的方向
居· 視野
深刻理解物體的平衡
我們是怎樣看到物體的
烏龜快跑
為什么同一物體在世界各地重量不一樣?
視野
真相
朝向坐標
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合