close

DeepMind官方解密新版 AlphaGo 棋藝制勝奇招:價值網絡把控通盤局面

本文首發於微信公眾號:新智元。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。


新智元報道編譯報道:文強劉小芹 零夏

【新智元導讀】4月10日,中國棋院與谷歌在北京宣佈,今年5月在“中國烏鎮·圍棋峰會”上AlphaGo升級版將與最頂尖的人類棋手進行對弈,世界冠軍柯潔將出戰。 隨後,DeepMind CEO Demis Hassabis 在官方博客上撰文介紹瞭這一比賽和全新版的 AlphaGo,並強調 AlphaGo 不僅會下棋,在節約能源、醫療、翻譯等方面也得到瞭應用。其團隊詳細也解讀瞭AlphaGo 在圍棋上的最新技術進步,包括策略和戰略上的創新。


今天,中國圍棋協會和浙江省體育局攜手Google共同宣佈,三方將聯合主辦“中國烏鎮·圍棋峰會”,屆時AlphaGo將再度與最頂尖的人類棋手進行對弈。這場為期5天,有關圍棋與人工智能的賽事將於5月23日至27日在中國最負盛名的水鄉古鎮、世界互聯網大會永久會址——浙江桐鄉烏鎮舉行。

在去年與圍棋世界冠軍李世石的對弈中,AlphaGo以出其不意的招法,給世人留下瞭深刻的印象,也給圍棋這項延續千年的智慧遊戲帶來瞭全新的想象力,同時也表明圍棋的奧妙仍有足夠的空間在等待我們去探索。

DeepMind CEO Demis Hassabis 在官方博客撰文文寫道:不像有些人擔心人工智能減弱瞭圍棋遊戲的樂趣那樣,相反,人工智能實際上使人類玩傢變得更強大,更多創新。圍棋作為可能是歷史上被研究和思考得最多的遊戲,不管是專業棋士還是業餘圍棋愛好者,在仔細研究 AlphaGo 創新的每一步棋時,實際上已經學到瞭新的知識和策略。

“AlphaGo 的下棋方式使我們感到自由,讓我們覺得沒有任何走棋是不可能的。現在人人都在嘗試從前沒有嘗試過的風格。” ——周瑞陽,九段棋士

顯然,最好的人類圍棋棋士和最具創新的圍棋 AI 對手之間的夥伴關系還有待更多認識。這就是為什麼我們很高興地宣佈 AlphaGo 下一步的計劃:在圍棋的發源地中國,參與為期五天的的圍棋峰會。

時隔一年,AlphaGo將與柯潔為代表的中國頂尖棋手一道,進一步追求圍棋的真諦。柯潔表示能和AlphaGo對戰是他的榮幸,面對大傢對最終輸贏的疑慮和關心,他表示自己一定要贏。整個活動柯潔多次表達自己拼勁全力求勝的決心,在微博也對AlphaGo說“來啊”,給自己打氣。


媒體會中也有觀點認為,這個賽事重要的意義不在於輸贏,更在於為人類更好地研究、開發和使用人工智能做出有益的嘗試。這個賽事是現代科技與中國傳統文化的美妙結合額,透過日新月異發展的人工智能,傳承瞭千年歷史的圍棋必將進一步閃耀出其智慧的光芒。


圖:憑借精湛的洞察力和毫不動搖的信心,柯潔以平穩的風格著稱,總是瞭解何時可大膽落子何時該謹慎行事。上圖中,Google 首席執行官 Sundar Pichai 訪問聶衛平在北京的圍棋道場時,柯潔(右一)與聶衛平(柯潔旁邊),樊麾(站著)和古力(左一)一起,憑借記憶復現 AlphaGo 與李世乭的一盤棋的開頭幾手,並向 Pichai 解釋這些落子之美。

根據大會安排,本次圍棋峰會內容豐富。其中AlphaGo與世界排名第一的柯潔的三番棋對弈無疑是眾人最關註的焦點。另外峰會還將舉辦配對賽和團隊賽兩場形式各異的交流比賽,配對賽中,兩位棋手將分別與AlphaGo組隊,挑戰棋手如何去理解AlphaGo的獨特風格並與之合作;在團隊賽中,將由五位中國頂尖棋手合作,建立棋手“神經網絡”,降低心理因素的影響,從而做出更加客觀的判斷。

Demis Hassabis 還介紹說,目前,已經有一些 AlphaGo 背後的機器學習方法被用於解決一些重要問題,例如減少能源使用。機器學習技術也已經被用於一系列令人興奮的醫學研究項目中。而且在 Google 的許多產品中,機器學習突然使得許多不可能變為可能——讓 Google Photos 的用戶能夠立即地在如山的照片中找到一張雪地上的狗的照片,比過去十年的改進加在一起還要多地一次性提高瞭 Google Translate 的翻譯質量,等等。

我們很期待這次的圍棋對弈和討論將帶來哪些見解,以及這些見解將如何幫助我們解決共同的挑戰——無論是圍棋上的挑戰還是其他挑戰。

AlphaGo 的創新在職業圍棋界中顯示出巨大的影響潛力,我們希望在即將到來的“中國烏鎮·圍棋峰會”上達成更多的合作研究機會。我們非常期待 AlphaGo 和人類專業棋士共同探索圍棋的真正本質!

4月10日,在中國棋院舉行的發佈會上,Demis 以視頻的方式發表講話。 AlphaGo 棋藝革新:三三定式(3-3 invasion)和妖刀定式


另一篇博客《Innovation of AlphaGo》上,DeepMind的軟件工程師與圍棋專業棋手樊麾共同講解瞭自去年以來AlphaGo在圍棋策略和戰術上的進步。

Alphago 強大之處並不在於單獨的一手或一連幾手,而是它為每一局對弈帶來的獨一無二的新視角。雖然圍棋的風格很難以一言以蔽之,但 AlphaGo 的策略象征瞭一種靈活和開放的精神:沒有先入為主的觀念,因此可以找到最有效的對弈策略。

正如以下兩局對弈所顯示的,這種思想經常使 AlphaGo 得出有悖直覺但十分強大的行動。

盡管圍棋是“圍地吃子”的遊戲,但是大多數決策類的戰鬥都講究雙方的力量平衡。AlphaGo 在維持平衡方面可謂一絕。具體說,AlphaGo 在運用“勢”方面能力精湛,也就是利用已經下定的棋子影響周圍的形勢。雖然這種“勢”無法量化,但 AlphaGo 的價值網絡使其能夠一次考慮到通盤的局面,從而做出細微且精確的判斷。這些能力讓 AlphaGo 將局部的“勢”擴展為全局的優勢。


在這局棋裡(Dia.1),黑子(AlphaGo)安全領域(secure territory)很少,而白子占據瞭三個角。但是,黑子的“勢”輻射到整個盤面。尤其是標記出的落子,雖然鞏固瞭白棋,但同時也增強瞭黑棋的可能性。圍棋選手通常會避免這樣的出招,因為這樣必定會付出代價,而回報卻不一定。但 AlphaGo 結合它對風險和獎勵強勁的判斷,最終下出瞭這一步棋。


但是,這些“勢”的價值全部取決於具體的場景。當這些“勢”能夠有效轉移時,AlphaGo 都自由地消去這些“勢”。在 Dia.2 中,AlphaGo 下出瞭驚人的 6 子連線(三角標記)。圍棋選手評價稱,在第四行(圓圈標記)有“勢”,在第三行有地(territory),但在第二行隻有敗局。AlphaGo 的走法最初看起來是符合這些評價的,這些落子給瞭白棋力量和“勢”。大多數圍棋選手都不會下出這樣的6子連在一起的棋。但是,AlphaGo 判斷這樣有助於將白棋分散開來,在接下來的過招中,慢慢地侵蝕白棋的優勢,從上方和下方同時確保瞭領先的優勢。

新的招式,新的模式

AlphaGo 在最近的幾句對弈中,還下出瞭一些開局的新招式。最引人註目的是開局的3-3入侵和“Magic Sword”的新變種。每個都違反瞭常規理論,但在更深入的反思中,卻證明是符合道理的。

初盤的三三定式(3-3 invasion)


這樣落子立馬就確保瞭角落的安全。但是,像 Dia.4 顯示的教科書式的接下來的開盤佈局,很早就被拋棄瞭,因為“勢”太多(it gives too much influence)。


AlphaGo 的創新之處在於,它省略瞭標記出的過招,讓角落處在 Dia.5 顯示的不確定(unsettled)的狀態。

盡管不那麼安全,黑子仍然保有從左邊逃出,或者在右邊落子占據角落的選擇,這樣就在僅僅減弱些微 influence 的情況下,占據瞭更多的領地(territory)。這個策略在職業棋手之間激起瞭熱烈的討論,而且至少已經有一個人在實際對弈中應用瞭這一招。

The New Magic Sord

AlphaGo 最初是使用人類的數據進行訓練的,因此它知道當代落子占角的下法,也通常按照這樣的順序落子。但是,在“Magic Sword”,也即被稱為“村正妖刀”的圍棋定式中,AlphaGo 卻出現瞭偏離。


然而,AlphaGo 往往更喜歡放棄外圍,贏取領地上的優勢(Dia. 9所示)。

大多數圍棋選手都不會考慮下這種棋,因為這樣黑棋雖然有很強的城墻(wall),但白棋的後手跟進讓黑棋的“勢”並沒有看上去那麼大。如果黑棋不繼續鞏固這面城墻,還會遭到攻擊。韓國頂尖棋手金志錫(Kim Jiseok)最近在一場比賽中用瞭這一系列落子(Dia. 10所示),他最終贏得瞭那場比賽。

AlphaGo 和柯潔對弈比賽規則

圍棋在各地的規則並不完全相同,中國大陸圍棋規則是數子法,日本圍棋規則和韓國圍棋規則是數目法,另外還有計點制度。一盤棋用三種規則計算出來的結果一般是相同的。本次烏鎮比賽采用中國規則。本次比賽詳細介紹如下:

1. 柯潔對戰AlphaGo:三番棋,無論輸贏都要下完三番,每方3小時,5次1分鐘讀秒;如果柯潔獲勝,將獲得150萬美元獎金;

2. 配對賽:兩位棋手分別與AlphaGo組隊,每方1小時,1?a href="http://iorange.biz/r/427710a145de7d73569730d56fc845b1">小額貸款 五萬?分鐘讀秒,將由連笑、古力將出戰;

3. 團隊賽:五位中國頂尖棋手合作,每方2小時30分,保留3次1分鐘讀秒,柯潔、周睿羊、時越、唐韋星、陳耀燁出戰

AlphaGo是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的程序,是圍棋史上最具實力的選手之一。2016年3月,在全世界超過一億觀眾的關註下,AlphaGo經過5局對弈,最終以4比1的總比分戰勝瞭圍棋世界冠軍李世石。此後,AlphaGo憑借其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。

近期,AlphaGo的升級版本以“Master/Magister”的稱謂與世界頂級的圍棋選手進行瞭60場線上快棋賽,並取得59勝1和棋。

一直以為,圍棋就被認為是傳統遊戲中對人工智能而言最具挑戰性的項目。這不僅僅是因為圍棋包含瞭龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過瞭簡單的啟發式算法。

為瞭應對圍棋的巨大復雜性,AlphaGo結合瞭監督學習和強化學習的優勢。通過訓練形成瞭一個策略網絡,將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡對自我對弈進行預測,以-1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索,實現瞭它的真正優勢。最後,新版的AlphaGo產生大量自我對弈棋局,為下一代版本提供瞭訓練數據,此過程循環往復。

在獲取棋局信息後,AlphaGo會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為AlphaGo的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力智商加入近似人類的直覺判斷。

文章來源:微信台中信用貸款利息公眾號新智元

(責任編輯:宋政 HN002)


和訊網今天刊登瞭《DeepMind官方解台南信貸利率最低台南個人信貸比較密新版 AlphaGo 棋藝制勝奇招:...》一文,關於此事的更多報道,請在和訊財經客戶端上閱讀。

台北個人信貸推薦
  • 真實案例講解:被貸款了怎麼辦?什麼是“被貸款”?桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的被貸款是指被他人假冒自己的名義在銀行辦理了貸款。桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的一些人在遭遇此類事件時,往往忍氣吞聲,不知該如何應對。事實上,被貸款了怎麼辦這個問題很好解決,只看你有沒有勇氣拿起武器捍衛自己的合法權益?有權要求認定合同無效【案例一】 2011105日,熊妍購買了一套商品房,當她交完首付,來到銀行辦理按揭手續時,卻遭到拒絕。理由是她曾辦理過三筆貸款,累計金額已達90萬元,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的不能再貸款了。銀行提供的查詢證明顯示,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的熊妍於2009年及2010年,在鄰縣一家銀行的確有著貸款記錄,每筆均為30萬元。“我根本就沒有在你們銀行貸過款,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的怎麼會有如此巨額的貸款記錄?”面對熊妍的質詢,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的鄰縣銀行卻無動於衷,因為他們知道,這只不過是領導親屬利用私自獲取的熊妍身份資訊辦理的貸款。桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的熊妍有權訴請法院確認三筆貸款合同無效。本案中,銀行領導為了自己親屬的利益,弄虛作假、串通一氣地連續三次利用私自獲取的熊妍身份資訊辦理貸款,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的客觀上也確已損害熊妍的利益,無疑當屬惡意串通。而《合同法》第五十二條規定:“有下列情形之一的,合同無效:……()惡意串通,損害國家、集體或者第三人利益桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的;……”《民法通則》第五十八條也已規定“惡意串通,損害國家、集體或者第三人利益的”民事行為無效。即銀行與真正貸款人的行為,桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的從開始起就對熊妍沒有法律約束力。
  • 桃園哪家銀行信貸利率低 目前哪家銀行信貸利率低且好過件的
  • 真實案例講解:被貸款了怎麼辦?什麼是“被貸款”?台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我被貸款是指被他人假冒自己的名義在銀行辦理了貸款。台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我一些人在遭遇此類事件時,往往忍氣吞聲,不知該如何應對。事實上,被貸款了怎麼辦這個問題很好解決,只看你有沒有勇氣拿起武器捍衛自己的合法權益?有權要求認定合同無效【案例一】 2011105日,熊妍購買了一套商品房,當她交完首付,來到銀行辦理按揭手續時,卻遭到拒絕。理由是她曾辦理過三筆貸款,累計金額已達90萬元,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我不能再貸款了。銀行提供的查詢證明顯示,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我熊妍於2009年及2010年,在鄰縣一家銀行的確有著貸款記錄,每筆均為30萬元。“我根本就沒有在你們銀行貸過款,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我怎麼會有如此巨額的貸款記錄?”面對熊妍的質詢,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我鄰縣銀行卻無動於衷,因為他們知道,這只不過是領導親屬利用私自獲取的熊妍身份資訊辦理的貸款。台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我熊妍有權訴請法院確認三筆貸款合同無效。本案中,銀行領導為了自己親屬的利益,弄虛作假、串通一氣地連續三次利用私自獲取的熊妍身份資訊辦理貸款,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我客觀上也確已損害熊妍的利益,無疑當屬惡意串通。而《合同法》第五十二條規定:“有下列情形之一的,合同無效:……()惡意串通,損害國家、集體或者第三人利益台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我;……”《民法通則》第五十八條也已規定“惡意串通,損害國家、集體或者第三人利益的”民事行為無效。即銀行與真正貸款人的行為,台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我從開始起就對熊妍沒有法律約束力。
  • 台東小額借錢 中國信託個人信貸試算金額,誰可以幫幫我
  • 真實案例講解:被貸款了怎麼辦?什麼是“被貸款”?高雄銀行信貸試算 中信信貸去哪邊辦?被貸款是指被他人假冒自己的名義在銀行辦理了貸款。高雄銀行信貸試算 中信信貸去哪邊辦?一些人在遭遇此類事件時,往往忍氣吞聲,不知該如何應對。事實上,被貸款了怎麼辦這個問題很好解決,只看你有沒有勇氣拿起武器捍衛自己的合法權益?有權要求認定合同無效【案例一】 2011105日,熊妍購買了一套商品房,當她交完首付,來到銀行辦理按揭手續時,卻遭到拒絕。理由是她曾辦理過三筆貸款,累計金額已達90萬元,高雄銀行信貸試算 中信信貸去哪邊辦?不能再貸款了。銀行提供的查詢證明顯示,高雄銀行信貸試算 中信信貸去哪邊辦?熊妍於2009年及2010年,在鄰縣一家銀行的確有著貸款記錄,每筆均為30萬元。“我根本就沒有在你們銀行貸過款,高雄銀行信貸試算 中信信貸去哪邊辦?怎麼會有如此巨額的貸款記錄?”面對熊妍的質詢,高雄銀行信貸試算 中信信貸去哪邊辦?鄰縣銀行卻無動於衷,因為他們知道,這只不過是領導親屬利用私自獲取的熊妍身份資訊辦理的貸款。高雄銀行信貸試算 中信信貸去哪邊辦?熊妍有權訴請法院確認三筆貸款合同無效。本案中,銀行領導為了自己親屬的利益,弄虛作假、串通一氣地連續三次利用私自獲取的熊妍身份資訊辦理貸款,高雄銀行信貸試算 中信信貸去哪邊辦?客觀上也確已損害熊妍的利益,無疑當屬惡意串通。而《合同法》第五十二條規定:“有下列情形之一的,合同無效:……()惡意串通,損害國家、集體或者第三人利益高雄銀行信貸試算 中信信貸去哪邊辦?;……”《民法通則》第五十八條也已規定“惡意串通,損害國家、集體或者第三人利益的”民事行為無效。即銀行與真正貸款人的行為,高雄銀行信貸試算 中信信貸去哪邊辦?從開始起就對熊妍沒有法律約束力。
  • 高雄銀行信貸試算 中信信貸去哪邊辦?

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
6100045260A3D1EB

arrow
arrow

    gyq208cq04 發表在 痞客邦 留言(0) 人氣()