24h購物| | PChome| 登入
2016-03-13 23:24:34| 人氣84| 回應0 | 上一篇 | 下一篇

AlphaGo是怎麼深層學習的?

推薦 0 收藏 0 轉貼0 訂閱站台

AlphaGo軟體,是採用「深層學習」技術,藉由複雜的統計方法,讓電腦從龐大且雜亂的資料中淬取出通用的法則,對於如何下棋發展出本身的直覺反應。電腦未來的戰力將不斷增強,不過距離一般通用的「人工智慧(AI)」還非常遙遠。
「深層學習」需要大量的處理能力、與可供學習的資料等兩項要件。DeepMind公司訓練電腦時,從網路上挑選出3,000萬種業餘及職業棋士對奕的棋譜,來與AlphaGo對戰。
這些資料被輸入到兩種「深層學習」演算模式中。其一稱為「政策網路」,訓練電腦模擬真人的下法;在觀察數以百萬計的對局之後,電腦學會如何找出各種特點、原則及法則,並產生且建議多種似乎可靠的下法。
第二套演算模式稱為「價值網路」,係依據「政策網路」的建議,評估每種下法的作用,及對手可能的反制,可能的情況達數千種。「價值網路」只評估後幾手的可能情況,而從過去的棋譜中尋找出最可能的勝著。「政策網路」與「價值網路」結合了真人棋手們多年來所累積的經驗。
AlphaGo的表現會隨著資料處理能力的增加而提升。這次的版本共使用1,920枚標準處理器晶片,及280枚原本用於電玩繪圖的特殊晶片。AlphaGo目前之所以能領先李世乭,是因為使用的硬體更有力。另外在程式碼中還隱藏著一、兩項「純手工」的特點,直接暗示電腦該如何下棋,而非讓電腦自行落子。AlphaGo的自我教學方式,使電腦能夠更像真人般下棋。
「深層學習」也是建立一般「人工智慧(AI)」的要件,即使電腦具有如人類般靈活的智慧,但目前科技還差得遠。「深層學習」演算模式的型態辨能力雖佳,但電腦仍缺乏許多人類普遍具備的心智工具。其中之一是「轉移學習」,AI研究人員稱之為「序列推理」,即將此處所學到的東西用於彼處。
「深層學習」也用來與電玩對戰。DeepMind去年發表的報告中,說明電腦能玩49種雅達利傳統電玩,包括「太空侵略者」及「爆發」,不需要任何輔助指令,成績超過任何真人玩家。
AlphaGo軟體,是採用「深層學習」技術,藉由複雜的統計方法,讓電腦從龐大且雜亂的資料中淬取出通用的法則,對於如何下棋發展出本身的直覺反應。電腦未來的戰力將不斷增強,不過距離一般通用的「人工智慧(AI)」還非常遙遠。「深層學習」需要大量的處理能力、與可供學習的資料等兩項要件。DeepMind公司訓練電腦時,從網路上挑選出3,000萬種業餘及職業棋士對奕的棋譜,來與AlphaGo對戰。這些資料被輸入到兩種「深層學習」演算模式中。其一稱為「政策網路」,訓練電腦模擬真人的下法;在觀察數以百萬計的對局之後,電腦學會如何找出各種特點、原則及法則,並產生且建議多種似乎可靠的下法。第二套演算模式稱為「價值網路」,係依據「政策網路」的建議,評估每種下法的作用,及對手可能的反制,可能的情況達數千種。「價值網路」只評估後幾手的可能情況,而從過去的棋譜中尋找出最可能的勝著。「政策網路」與「價值網路」結合了真人棋手們多年來所累積的經驗。AlphaGo的表現會隨著資料處理能力的增加而提升。這次的版本共使用1,920枚標準處理器晶片,及280枚原本用於電玩繪圖的特殊晶片。AlphaGo目前之所以能領先李世乭,是因為使用的硬體更有力。另外在程式碼中還隱藏著一、兩項「純手工」的特點,直接暗示電腦該如何下棋,而非讓電腦自行落子。AlphaGo的自我教學方式,使電腦能夠更像真人般下棋。「深層學習」也是建立一般「人工智慧(AI)」的要件,即使電腦具有如人類般靈活的智慧,但目前科技還差得遠。「深層學習」演算模式的型態辨能力雖佳,但電腦仍缺乏許多人類普遍具備的心智工具。其中之一是「轉移學習」,AI研究人員稱之為「序列推理」,即將此處所學到的東西用於彼處。「深層學習」也用來與電玩對戰。DeepMind去年發表的報告中,說明電腦能玩49種雅達利傳統電玩,包括「太空侵略者」及「爆發」,不需要任何輔助指令,成績超過任何真人玩家。

台長: 估車
人氣(84) | 回應(0)| 推薦 (0)| 收藏 (0)| 轉寄
全站分類: 教育學習(進修、留學、學術研究、教育概況)

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文