强烈建议你试试无所不能的chatGPT，快点击我

AlphaZero完胜三大世界冠军棋类程序：5000个TPU、自学一天

阅读量：7050 次

发布时间：2019-06-28

本文共 883 字，大约阅读时间需要 2 分钟。

本文来自AI新媒体量子位（QbitAI）

昨天，DeepMind团队又在arXiv上扔了个重磅炸弹，新一代AlphaZero在用了强劲的计算资源（5000个一代TPU和64个二代TPU）之后，用不到24小时的时间自我对弈（tabula rasa，也叫白板）强化学习，接连击败了三个世界冠军级的程序 (国际象棋、将棋、围棋)。

△ AlphaZero和国际象棋冠军程序对弈

其中包括上一代冠军围棋程序AlphaGo Zero，这个程序发布还不到两个月，DeepMind就又把自己颠覆了（所以谷歌团队自我进化速度的时间单位都是按天计，可怕）。

AlphaZero的百局战绩

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

对弈国际象棋程序Stockfish：28胜，72平；

对弈将棋程序 Elmo：90胜，2平，8负；

对弈围棋程序AlphaGo Zero：60胜，40负。

AlphaZero自我对弈的训练时间

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

训练次数 | 训练时间 | 对弈冠军棋类程序

30万，2小时，击败将棋Elmo

11万，4小时，击败国际象棋Stockfish

16.5万，8小时，击败围棋AlphaGo

把Go去掉，意味着AlphaZero ，已经是比AlphaGo Zero更通用的程序。

一直以来，尽管众多顶尖的AI的程序都超过了人类世界冠军的水平，但它们都只能在单一的领域执行单一的任务，并不能把这种击败人类的超能力泛化到其他任务中。

而DeepMind的野心可不仅仅是在棋类游戏上超越人类，这次他们研究出了这个更通用的程序AlphaZero，将会马上投入到蛋白折叠的应用上。

官方称，他们不久就会发表相关论文，通过检测出蛋白错误折叠来快速诊断神经退行性疾病，比如阿尔茨海默症，帕金森，囊状纤维化。

期待AlphaZero在医疗健康领域的表现。

更多棋技的讨论，可以参看知乎上的PENG Bo的评价：https://zhuanlan.zhihu.com/p/31749249

原论文链接：https://arxiv.org/pdf/1712.01815.pdf

— 完 —

本文作者：Root

原文发布时间：2017-12-07

转载地址：http://qocol.baihongyu.com/

你可能感兴趣的文章

mybatis 实体嵌套查询

跨境物流链路怎么做？菜鸟工程师打造了全球通关“神器”

mysql数据库的修改

Ubuntu Server 16升級到Ubuntu Server 18操作步驟

Android中ViewGroup

世界上最受欢迎的10个Linux发行版

Ubuntu 14.04数据库服务器--mysql的安装，配置，卸载

网站后端_Python+Flask.0005.FLASK调试模式之开启DEBUG与PIN使用?

用pushd、popd和cd - 快速定位目录

Android安全防护之旅---带你把Apk混淆成中文语言代码

mysql清空表的方法

Http协议及apache配置笔记

读书笔记-大颠狂（非同寻常的大众幻想与群众性癫狂）

MySQL 多条数据的一个字段合并

jquery AJAX清除IE缓存问题

Percona XtraBackup (译一)：首页

一大早就解决了个服务器***问题

配置 WebLogic Maven Plug-In 远程部署weblogic

聊一聊Java中的系列化

Objective-c 继承，多态，封装

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-07 07:32:09 当前IP: 18.188.254.182 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我