通過從與不同水準的玩家的數千盤圍棋博弈中學習, AlphaGo已經學會了玩這個遊戲。 它最終擊敗了圍棋冠軍Lee Sedol,
令人印象深刻的是, AGZ能夠在沒有研究人員的幫助或投入的條件下完全依靠自己的能力達到專業棋手水準。 該團隊認為, 通過跳過人類輸入階段可以擁有優勢:“人類的知識可能對於解決一些問題來說太昂貴、太不可靠或根本無法使用。 ”然而, 真正令人震驚的是, AGZ人工智慧在發展自己的技能方面可以走得更遠。
DeepMind的首席執行官兼聯合創始人Demis Hassabis在谷歌的Go North大會上說, 關於AGZ, “我們從來沒有真正探索出這個版本的AlphaGo的能力能到達多高的一個高度。
AGZ可以進行重新啟動, 這可以幫助人類圍棋玩家學習新的落子方式和策略。 人工智慧也可以被重新指派到解決其他的問題。 研究人員說, 這些任務可能包括很多類別, 比如:蛋白質折疊問題, 如何減少能量消耗, 或者尋找革命性的新材料。 AGZ有潛力創造一個更美好的社會, 而開發團隊也在進一步探索它。
不過,
也有業內人士指出,
“拋棄人類經驗”和“自我訓練”並非AlphaGo Zero最大的亮點,
其關鍵在於採用了新的reinforcement learning(強化學習的演算法),
並給該演算法帶了新的發展。
那麼,
小夥伴們又如何看待此事呢?