博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天
阅读量:7050 次
发布时间:2019-06-28

本文共 883 字,大约阅读时间需要 2 分钟。

本文来自AI新媒体量子位(QbitAI)

昨天,DeepMind团队又在arXiv上扔了个重磅炸弹,新一代AlphaZero在用了强劲的计算资源(5000个一代TPU和64个二代TPU)之后,用不到24小时的时间自我对弈(tabula rasa,也叫白板)强化学习,接连击败了三个世界冠军级的程序 (国际象棋、将棋、围棋)。

 AlphaZero和国际象棋冠军程序对弈

其中包括上一代冠军围棋程序AlphaGo Zero,这个程序发布还不到两个月,DeepMind就又把自己颠覆了(所以谷歌团队自我进化速度的时间单位都是按天计,可怕)。

AlphaZero的百局战绩

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

  • 对弈国际象棋程序Stockfish:28胜,72平;
  • 对弈将棋程序 Elmo:90胜,2平,8负;
  • 对弈围棋程序AlphaGo Zero:60胜,40负。

AlphaZero自我对弈的训练时间

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

  • 训练次数 | 训练时间 | 对弈冠军棋类程序
  • 30万,2小时,击败将棋Elmo
  • 11万,4小时,击败国际象棋Stockfish
  • 16.5万,8小时,击败围棋AlphaGo

把Go去掉,意味着AlphaZero ,已经是比AlphaGo Zero更通用的程序。

一直以来,尽管众多顶尖的AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的领域执行单一的任务,并不能把这种击败人类的超能力泛化到其他任务中。

而DeepMind的野心可不仅仅是在棋类游戏上超越人类,这次他们研究出了这个更通用的程序AlphaZero,将会马上投入到蛋白折叠的应用上

官方称,他们不久就会发表相关论文,通过检测出蛋白错误折叠来快速诊断神经退行性疾病,比如阿尔茨海默症,帕金森,囊状纤维化。

期待AlphaZero在医疗健康领域的表现。

更多棋技的讨论,可以参看知乎上的PENG Bo的评价:https://zhuanlan.zhihu.com/p/31749249

原论文链接:https://arxiv.org/pdf/1712.01815.pdf

本文作者:Root 
原文发布时间:2017-12-07

转载地址:http://qocol.baihongyu.com/

你可能感兴趣的文章
mybatis 实体嵌套查询
查看>>
跨境物流链路怎么做?菜鸟工程师打造了全球通关“神器”
查看>>
mysql数据库的修改
查看>>
Ubuntu Server 16升級到Ubuntu Server 18操作步驟
查看>>
Android中ViewGroup
查看>>
世界上最受欢迎的10个Linux发行版
查看>>
Ubuntu 14.04数据库服务器--mysql的安装,配置,卸载
查看>>
网站后端_Python+Flask.0005.FLASK调试模式之开启DEBUG与PIN使用?
查看>>
用pushd、popd和cd - 快速定位目录
查看>>
Android安全防护之旅---带你把Apk混淆成中文语言代码
查看>>
mysql清空表的方法
查看>>
Http协议及apache配置笔记
查看>>
读书笔记-大颠狂(非同寻常的大众幻想与群众性癫狂)
查看>>
MySQL 多条数据的一个字段合并
查看>>
jquery AJAX清除IE缓存问题
查看>>
Percona XtraBackup (译一):首页
查看>>
一大早就解决了个服务器***问题
查看>>
配置 WebLogic Maven Plug-In 远程部署weblogic
查看>>
聊一聊Java中的系列化
查看>>
Objective-c 继承,多态,封装
查看>>