?

AlphaGo:算法的勝利

2016-04-22 02:25趙言昌
大眾科學 2016年4期
關鍵詞:招牌菜奇點川菜

趙言昌

2016年3月15日,谷歌阿爾法狗(AlphaGo)與韓國九段棋手李世石進行“人機大戰”第五場對弈,經過五個小時的博弈,最終,谷歌AlphaGo獲勝。

AlphaGo的勝利,是深度學習的勝利,也是算法的勝利。你鼠標的每一次點擊,你在手機上完成的每一次購物,天上飛的衛星,水里游的潛艇,拴著你錢袋子的股票漲跌——我們這個世界,正是建立在算法之上的。

那么,什么是算法,你對它又了解多少?

齊軍煮粥與枚舉法

一直以來,計算機科學都給人一種高深莫測的感覺,人們對其有很多“高大上”的印象,其實,它也有一些你我早已熟識的東西。

例如:電影《戰國》中,孫臏(孫紅雷飾)帶領齊國軍隊打仗,半路上收留了幾百個災民。齊國的情報系統告訴孫臏,災民之中有敵國奸細。那么,倉促之間,如何判斷誰才是敵人?

孫軍師心生一計,囑咐手下人煮粥,并在粥里加了很多辣椒。如此味道,一般人肯定是不肯喝的,但災民就不一樣了。都快餓死了,誰還敢挑食?下屬們紛紛稱贊軍師神算……

那么,有沒有更好的方法呢?

有!狠下心,挨個兒殺,總會把奸細殺死。

電腦有時就是這么處理問題的:五把鑰匙里,有一把是對的,一把一把試過去,總能打開鎖。這就是枚舉法,聽起來有些弱智,但是計算機的運算速度很快,所以至今仍有用武之處。

考場作弊與數據壓縮

隨著網絡的應用越來越普遍,很多人都愛花錢辦會員,在線或下載下來收聽無損歌曲。那么,無損音樂是怎么回事?

這就要從數據壓縮說起。

比如,考試時,你身后坐的一位后進同學小聲跟你要選擇題的答案。假設一共有20道選擇題,每道題的答案都是A,你是挨個給他念一遍呢,還是說一句,“都是A”?正常人肯定會選后者,不僅省時、省事,而且沒有信息損失,和“AAAAAAAAAAAAAAAAAAAA”效果一致。

在此過程中,你通過統計分析,總結出規律,用更少的字段去描述全部信息,這就是無損壓縮。

那么,有損壓縮又是什么樣的?比如,你愛上一個姑娘,她在北京,你在上海。聚少離多,思念日增,你想要知道對方每時每刻的樣子。不過,總不能請個攝影師24小時跟拍吧。于是你們約定,選幾個特定時刻,早上起床什么樣,晚上睡前什么樣,白天工作什么樣,周末休息什么樣。

就這樣,24小時的內容,被壓縮到幾分鐘,數據量大為減少,這是好處一;有些情況你看不到,這是壞處一;照片到了你手里,你就可以根據你對她的了解,近似還原她的狀態,這是好處二。

“兩利相權取其重”,有損壓縮因此風靡。

比如刷微博時,你上傳一張自拍,新浪的服務器會將照片還原成一個個明暗變化的小點,然后用有損壓縮。比如,可以每隔幾行剪掉一部分數據,用臨近小點的明暗數值補齊。新浪節省了存儲空間,你減少了流量費,而圖片質量區別并不是很大,何樂而不為?

外星探索與公鑰加密

公鑰加密是一種很古老的做法——在計算機領域,超過10年就算古董了。

公鑰加密是由對應的一對唯一性密鑰(即公開密鑰和私有密鑰)組成的加密方法,是目前商業密碼的核心?!肮€”,顧名思義,鑰匙是公開的。

比如,你和你的好朋友小明被聘請為人類外星探索先行官,降落在某個地外星球上。不料,這顆星球上是有原住民的,他們把你倆抓了起來,并監控了你倆的通信頻道。

小明問:“你現在還有多少子彈?”

你要是直接說數字,外星人馬上會知道,你要是說“N+5”,小明又不知道N是多少。

就在這個時候,你發現外星人不懂乘除法。該如何利用這一情況呢?

首先,你還是用加密信息,告訴小明:“我的子彈數是N×9?!?/p>

然后,你說:“任選一個數字?!?/p>

外星人自然會聽到,不過沒關系,數字是無窮的,撞車的概率很小。你選了3,小明選了2。

接下來,你用3乘以9,得到27;小明也一樣,他用2乘以9,得到18;至于外星人,他們選的數字和你們不一樣,得出的結果自然也不一樣。

隨即,你公布“答案是27”,小明也公布,“答案是18”。

最后是見證奇跡的時刻:你用小明公布的數字18,乘以你的私密數字3,得到54;小明呢,他用27乘以2,結果也一樣——(2×9)×3=(3×9)×2。

我們逛淘寶的時候,正是經歷了這樣的場景。你發出的付款信息,要經過多個服務器轉接。如果不加密,你的支付信息就會暴露在互聯網上;你自定義一套密碼,安全倒是安全,但淘寶也不知道你說的什么,老是“支付失敗”你能樂意嗎?因而,必須用公鑰加密信息。

所以,并不是“敗家娘們”通過“買買買”讓馬云當上了首富,技術進步才是淘寶成功的關鍵之一。

“川菜招牌菜”與匹配排名

谷歌初創時,不過是斯坦福大學的一個學生研究項目。20年來,從十萬美元的初始投資到一千多億美元的資產凈值,從一個小小的搜索框到涵蓋手機、通訊、在線教育等數個領域的互聯網大鱷,谷歌深遠地影響了世界。

為什么谷歌風靡全球?因為谷歌的搜索引擎特別好用。

為什么谷歌的搜索引擎那么好用?因為谷歌的匹配與排名算法極其優秀。

比如,當我們用谷歌搜索“川菜的招牌菜是什么”時,谷歌的服務器首先要進行匹配,找到我們想要的網頁;其次要進行排名,判斷不同網頁的優先度,將我們最想要的,排在最前面。

匹配就像查字典,難的是如何教會計算機查字典?!按ú说恼信撇恕笔瞧陶Z,“川菜”用來修飾“招牌菜”,計算機不懂這些。所以,計算機首先要把互聯網上的網頁都看一遍,找到所有含有“川菜”的網頁和所有含有“招牌菜”的網頁,將二者進行對比,找出重復的部分。而這,大概就是用戶需要的。

問題是,這些網頁很多,可能有幾百萬個,怎么對它們進行排序呢?總不能一股腦都擺第一頁吧?否則,50寸的顯示器也不夠用吶。

谷歌的崛起,就是因為排名。1998年,谷歌創始人拉里·佩奇和謝爾蓋·布林發表了《解析大規模超文本網絡搜索引擎》。

當時,由于技術限制,人們還不可能讓計算機直接模擬人腦,分辨哪些重要、哪些不重要。對此,佩奇和布林找到了一個計算機可以辨識的指標:PageRank值。

PageRank值可以簡單理解為網頁的被引用次數。比如有一百個網頁既包含“川菜”又包含“招牌菜”,符合搜索要求。其中,有九十九個網頁通過超鏈接提到了最后一個網頁,那么,最后一個網頁,就是最貼近用戶需要的。

謝耳朵認臉與圖像識別

PageRank值本質上是一種等價思想,用一種計算機可以使用的衡量標準,取代人類的衡量標準,“數值高”就等于人們“最想要”。如此一來,計算機就能出色地完成我們交付的任務。

有時候,問題并不是這么簡單。舉個例子,計算機該如何進行圖像識別呢?更進一步講,計算機能不能辨識人臉以至于認識到人的喜怒哀樂?

喜愛看美劇的人,對于《生活大爆炸》中的謝耳朵肯定不會陌生,他既是一個物理學方面的天才,十幾歲就開始攻讀博士學位,讓人欽佩;也是一個生活中的弱智,連朋友是開心還是生氣都看不出來,令人莞爾。

如果謝耳朵花錢請你教他識別面部表情,你該怎么做呢?

你的第一反應,可能是找一臺攝像機,把他朋友的喜怒哀樂都記錄下來,一個一個地分析給謝耳朵聽,讓他記住重點,開心的時候,眉毛在哪,嘴唇如何,生氣的時候又是怎樣,區別在哪里。

思路沒有什么大錯,只是有兩個缺陷:第一,每一個人每次笑,都有些許不同,還有“激動地流淚”、“長歌當哭”這種場景;第二,就算他學會了,他也只能辨識朋友們的面部表情,陌生人的則不行。

所以,我們改進方案。首先,選取最典型的長相;接著,尋找最典型的表情;最后,設立一個決策樹。計算機進行圖像識別的方式也與此類似,當計算機拿到一張照片時,它沿著決策樹,將測試數據和之前的樣本數據進行對比。

最終,計算機給出結論,“這是一張男人的照片,他在哭”。研究人員再對結果進行判斷,給予獎勵或者修正。這樣,計算機就能逐步地建立一個決策體系,準確地識別人的表情。

奇點與未來

在物理上,有觀點認為宇宙起源于奇點。奇點是指一個體積無限小、密度無限大的點,所有的物理定律都對它不適用;仿照這一概念,有人提出了技術奇點,認為在未來某一時刻,技術會發生近乎無限的進步,使得我們之前的預測和生活方式都失效。

很多名人,如比爾·蓋茨、史蒂芬·霍金,都曾發出警告,認為人工智能可能就是這個奇點,超級計算機也許會導致人類的毀滅。如今,AlphaGo在“人機大戰”中已取得壓倒性勝利。那么,計算機技術的奇點真的已經到了嗎?未來人類又將走向何方?(編輯/余風)

猜你喜歡
招牌菜奇點川菜
趣談一筆畫
秋夜里的歌唱家
“川菜”的由來
蜇人后會死的蜜蜂
爸爸的“招牌菜”
如何把時評漫畫做成紙媒“招牌菜”
第二道 川菜資格人
川菜資格人
廚娘
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合