?

AlphaGo:人工智能邁出一大步背后的秘密

2019-09-10 07:22樂佳
電腦報 2019年21期
關鍵詞:落子李世石棋盤

樂佳

近日,搜狗CEO王小川在發表公開演講時,動情地回憶起了2016年他在新浪直播全程見證了李世石被機器打敗,并坦言當時對他沖擊很大,他認為那是人類歷史上堪比文藝復興的一場啟蒙運動。今天我們再來深入地解讀一下,阿爾法狗——人工智能邁出一大步背后的秘密。

2016年3月,由谷歌旗下公司DeepMind開發的人工智能程序阿爾法狗(AlphaGo)以總比分4:1戰勝韓國天王級職業圍棋選手李世石九段。此役使得AlphaGo聲名鵲起,也使得人工智能、深度學習成為了世人關注的熱點。僅僅過了幾個月,同年的12月29日,一個神秘賬號“Master”出現在了中文網絡圍棋平臺弈城網上,并在短短幾日之內以60勝0負1和的傲人戰績戰勝了包括世界排名第一的柯潔九段、“棋圣”聶衛平在內的多個職業圍棋領域的大師級人物。當人們還在震驚中猜測Master到底是何方神圣時,Google對外宣布Master的真實身份就是AlphaGo。AlphaGo是人工智能領域的一個里程碑,它的出現昭示著人工智能領域的研究又向前邁進了一大步。那么,AlphaGo到底有何過人之處,其在圍棋領域取得的成績為何會產生如此之大的反響?

其實,人工智能在棋類運動中戰勝人類早已有先例,早在1997年5月IBM的“深藍計算機”在國際象棋比賽中就戰勝了當時的世界衛冕冠軍卡斯帕羅夫。相較于國際象棋,圍棋具有更復雜的規則和更多的棋盤狀態,所以在“深藍”戰勝了世界冠軍后的很長一段時間內很多人都認為計算機在圍棋上是無法戰勝人類的,甚至有人把圍棋稱為“人類最后的堡壘”。而如今,“人類最后的堡壘”也已經被攻破,勢必會引起人們的強烈反應。

AlphaGo的成功一方面得益于硬件設備計算能力的極大提升,相較于20年前,如今計算設備的計算能力有了質的飛躍;另一方面,則得益于采用了深度學習算法。同“深藍”采用的暴力解題的方式不同,AlphaGo通過使用深度學習來獲得更加抽象的概念。AlphaGo的核心組成是兩個卷積神經網絡(Convolutional Neural Networks, CNN):策略網絡(Policy Network)和價值網絡(Value Network)。簡單來說,策略網絡用于針對當前棋盤,輸出在當前棋盤各個空白處落子的概率;價值網絡則會給出在各個位置落子后的勝率;最后,AlphaGo使用一種蒙特卡羅樹搜索(Monte Carlo Tree Search, MCTS)算法結合前面的兩個網絡輸出最佳的落子策略。因此,AlphaGo厲害之處就在于當它的對手可能還在思考下在哪里的時候,它已經猜出了對手可能下子的位置,并利用對手思考的時間,繼續計算后面的棋路。此外,AlphaGo還使用了強化學習算法(Reinforcement Learning, RL):通過讓策略網絡不斷地自我對弈,來不斷提升策略網絡預測落子概率的準確性。當然,AlphaGo的實際計算過程比這要復雜得多,此處主要是為了方便理解而對其對弈的計算過程做了大量的簡化。

人工智能一般可以分為弱人工智能和強人工智能,兩者最大的區別在于制造出來的智能機器是否具有自我意識。強人工智具有理解問題、思考問題、計劃并解決問題的能力,甚至擁有自我意識和知覺。而弱人工智能雖然能解決一些人類才能解決的問題,但實際上它并不真正具備理解問題、思考問題的能力,也沒有自我意識。自從AlphaGo擊敗眾多圍棋高手以來,不少人都覺得人類離人工智能統治人類的那一天又更近了一步。其實,盡管AlphaGo的確是人工智能領域的一個里程碑,但本質上AlphaGo仍然是一個計算機程序,它沒有自我意識,也沒有真正理解圍棋,它只是算出了幾個可以構建最佳落子策略的函數而已,它仍然屬于弱人工智能。

猜你喜歡
落子李世石棋盤
琴(外一首)
武安平調落子研究文獻調查分析
落子滄州
人機大戰
李世石稱自己仍能戰勝谷歌的人工智能
棋盤人生
棋盤里的天文數字
棋盤疑案
棋盤游樂園
李世石“天才”繼承人
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合