Linux中國

AlphaGo 的首爾之戰帶來的啟示

雖說圍棋可能是存世的最為悠久的遊戲之一了,但對於這五盤比賽的關注度還是大大的超出了我們的想像。搜索圍棋規則和圍棋盤的用戶在美國迅速飆升。在中國,數以千萬計的用戶通過直播觀看了這場比賽,並且新浪微博「人機圍棋大戰」話題的瀏覽量破 2 億。韓國的圍棋盤也銷量激增

然而我們如此公開的測試 AlphaGo,並不僅僅是為了贏棋而已。我們自 2010 年成立 DeepMind,為的是創造出具有獨立學習能力的通用型人工智慧(AI),並致力於將其作為工具協助解決,從氣候變化到診斷疾病,這類最為棘手且急迫的問題為最終目標。

亦如許多前輩學者們一樣,我們也是通過遊戲來開發並測試我們的演算法的。在一月份,我們第一次披露了 AlphaGo——作為第一個通過使用 深度學習強化學習,可以在人類發明的最為複雜的棋盤類遊戲中擊敗職業選手的 AI 程序。而 AlphaGo 迎戰過去十年間最厲害的圍棋選手——李世石,絕對稱得上是 終極挑戰

結果震驚了包括我們在內的每個人,AlphaGo 五戰四勝。評論家指出了 AlphaGo 下出的許多前所未見、極富創意或者要用 「漂亮」 來形容的妙手。基於我們的數據分析,AlphaGo 在第 2 局中的 37 手,在人類選手中出現的幾率僅有萬分之一。而李一反常態的創新下法,如第 4 局中的 78 手——也是既存下法中的萬中之一的——這一手也最終造就了一場勝利。

最後比分定格在 4-1。我們為支持科學、技術、工程、數學(STEM)教育和圍棋的組織,以及 UNICEF (聯合國兒童基金會)贏得了 $1 百萬的捐助。

經此一役,我們將收穫總結成以下兩點:第一,此次測試很好的預示了 AI 有解決其他問題的潛力。AlphaGo 在棋盤上能夠做到兼顧「全局」——並找出人類已經被訓化而不會走或想到的妙手。運用 AlphaGo 這類的技術,在人類目所不能及的領域中探索,會有很大的潛力。第二,雖說這場比賽已經被廣泛的標榜成「人機大戰」,但 AlphaGo 卻是人類實實在在的成果。無論是李世石還是 AlphaGo 團隊相互之間互相促進,產生了新的想法、觀點和答案——並且長遠來看,我們都將從中受益。

但正如韓國對於圍棋的觀點:「勝而不驕,是以常勝。」這只是使機器聰明的漫長道路中的一個小小而顯著的一步而已。我們已經證明了尖端深度強化學習技術可以被用作製作強大的圍棋選手和 Atari 玩家。深度神經網路在 Google 已經與 圖像識別語音識別 以及 搜索排名 一樣被應用到具體的任務中了。然而,從會學習的機器到可以像人一樣全方位靈活實施智能任務——真正達到 強人工智慧 的特性,此中的道路還很漫長。

我們想通過這場比賽來測試 AlphaGo 的極限。李世石大師做的十分出色—我們在接下來的數周內會研究他與 AlphaGo 的對戰細節。同時因為我們在 AlphaGo 中使用的機器學習方法是通用型的,我們十分希望在不久的將來,將這種技術應用於其他的挑戰中。遊戲開始!

via: https://googleblog.blogspot.com/2016/03/what-we-learned-in-seoul-with-alphago.html

作者:Demis Hassabis 譯者:martin2011qi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國