技术控

    今日:136| 主题:49228
收藏本版 (1)
最新软件应用技术尽在掌握

[其他] DeepMind论文:结合生成式对抗网络和Actor-Critic方法

[复制链接]
原来完美并不美 发表于 2016-10-8 13:11:30
146 3

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

DeepMind论文:结合生成式对抗网络和Actor-Critic方法-1 (稳定性,信息流,文章,论文,网络)

   摘要:

   无监督学习中的生成式对抗网络和强化学习中的 actor-critic 方法都是出了名的难以优化。两个领域的实践者都积累了大量的策略缓和这些不稳定性,并改进训练。在此论文中,我们表示 GAN 可被视为在 actor 不能影响 reward 的环境中的 actor-critic 方法。我们通过为每一类模型进行稳定训练来检阅这一策略,无论是一般的模型还是特定的模型。我们也使用更复杂的信息流检查了一些对 GAN 和 RL 算法的拓展模型。我们期望通过重视这类连接,能够鼓励 GAN 和 RL 研究社区开发出更泛型、更可扩展的、更稳定的算法,从而对神经网络进行多层的优化,也期望我们的方法能给各个社区以启发。
    论文地址:  Connecting Generative Adversarial Networks and Actor-Critic Methods  
       声明:本文由机器之心编译出品,原文来自arXiv.org,作者:David Pfau、Oriol Vinyals,,机器之心对于违规侵权者保有法律追诉权。
   
       
  • 网站转载请在文章开头粗体注明:本文转载自机器之心,标明作者,并附上本文链接。   
  • 微信公众号转载请在开头粗体注明:本文转载自机器之心,标明作者,并设置阅读原文链接为本文链接,[email protected]   
  • [email protected]iqizhixin.com说明,备注转载文章标题、转载的微信号名称和转载日期。   
  • 机器之心只接受如上几种转载方式,其余均视为侵权,[email protected]   

友荐云推荐




上一篇:分布式数据库模式与反模式
下一篇:JavaScript arguments 对象全面介绍
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

22335589 发表于 2016-10-24 09:24:24
2016-10-24是个特别的日子,值得纪念!
回复 支持 反对

使用道具 举报

李孟秋 发表于 2016-11-16 15:49:58
我承认我是因为标题才进来的
回复 支持 反对

使用道具 举报

崩坏学园 发表于 2016-11-17 11:01:02
不回帖,臣妾做不到啊!
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表