产品设计

    今日:113| 主题:15712
收藏本版 (1)
软件产品、PC、移动、网站、平台的开发、策划等内容。

[其他] 深度学习研究总结:生成对抗网络(附 3 篇 arXiv 最火论文)

[复制链接]
键盘下的忧伤 发表于 2016-10-3 20:18:18
327 11

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
1 新智元编译  1
       源:adeshpande3.github.io  
  作者: Adit Deshpande

  翻译:刘小芹
  新智元祝读者国庆节快乐!
    AI World 2016世界人工智能大会  ? 业界领袖回溯60年AI历史,全球对话人工智能未来挑战,权威发布2016世界人工智能名人堂及中国人工智能产业发展报告;? 国际大咖“视频”远程参会, Bengio 和李飞飞联袂寄语中国人工智能;? 探秘讯飞超脑及华为诺亚方舟实验室,最强CTO与7大研究院院长交锋;? 滴滴CTO与百度首席架构师坐镇智能驾驶论坛,新智元三大圆桌阵容史无前例;? 中国“大狗”与"X-Dog"震撼亮相,龙泉寺机器僧“贤二”卖萌。
   【新智元导读】  Yann LeCun曾说:“对抗训练是切片面包发明以来最令人激动的事情”。这篇文章中,作者回顾基于 Ian Goodfellow 在2014 年的开创性工作的 3篇论文。这3篇论文都是过去一年来在arXiv.org上讨论十分热烈的论文,包括  Twitter Cortex团队几周前发表的论文。 在新智元后台输入1003下载论文。    
  生成对抗网络概述

   我在此前的一篇博文( 9 Deep Learning Papers You Should Know About )中简要地提到过Ian Goodfellow有关生成式对抗网络的论文。这些网络的要点是:有两个模型,一个是生成模型(generative model),一个是判别模型(discriminative model)。判别模型的任务是判断给定的图像看起来是自然的还是人为伪造的(图像来源于数据集)。生成模型的任务是生成看起来自然真实的、和原始数据相似的图像。这可以看做一种零和或两个玩家的纸牌游戏。本文采用的类比是生成模型像“一个造假团伙,试图生产和使用假币”,而判别模型像“检测假币的警察”。生成器(generator)试图欺骗判别器(discriminator),判别器则努力不被生成器欺骗。模型经过交替优化训练,两种模型都能得到提升,直到到达一个“假冒产品和真实产品无法区分”的点。
   对抗网络的 拉普拉斯金字塔(Laplacian Pyramid)
  对抗网络最重要的用法之一是经过充分训练生成器之后生成看起来自然的图像。下面这些是Goodfellow在2014年的论文中生成器输出的一些样本。
   
深度学习研究总结:生成对抗网络(附 3 篇 arXiv 最火论文)-1 (诺亚方舟,人工智能,Twitter,龙泉寺,百度)

  如图所见,生成器在生成数据和人脸时效果很好,但使用CIFAR-10数据集时,生成的图像就十分模糊。
  为了解决这个问题,Emily Denton, Soumith Chintala, Arthur Szlam 以及Rob Fergus合作发表了论文《利用对抗网络拉普拉斯金字塔的深度生成图像模型》(Deep Generative Image Models using Lapalacian Pyramid of Adversarial Networks)。这篇论文的主要贡献一种网络架构,它制作的高质量合成图像由人类检查时,40%的时候与真实图像难以区分。
  方法

  在介绍论文前,让我们回顾一下在GAN中生成器的任务。生成器需要生成大型、复杂,还要真实度能骗过经过训练的判别器的图像。这可不是简单的任务。为了解决这个问题,该论文的作者们使用多个CNN模型在扩大的规模中连续生成图像。论文作者之一的Emily Denton在LAPGAN的演讲中说:
  “生成低分辨率的图像很简单。根据低分辨率图像生成分辨率高一点的图像也不算难。”
  该论文的方法是建一个拉普拉斯金字塔生成模型。拉普拉斯金字塔是由连续疏密度的一系列滤波图像组成的图像表征。这个金字塔表征的每一层包含特定规模的图像信息。它是一种原始图像的分解。
  让我们回顾一下一个样本GAN的输入和输出。生成器接收分布的噪声矢量输入,然后输出图像。判别器得到这张图像(或一张来自训练数据的真实图像),然后输出一个判断该图像“真实度”的标量。现在让我们看看附条件的GAN(conditional GAN,CGAN)。其它内容都相同,不过判别器和生成器得到的输入是另外一些信息,这些信息的形式是一些分类标签,或另一张图像。
  网络架构

  论文作者提出一套convnet模型,金字塔的每一层都包含与之关联的convnet。这和传统GAN结构的变化是,传统GAN只能由一个生成器CNN生产整个图像,而新的模型由一系列的CNN通过渐渐增加分辨率(即经过金字塔)连续生成图像,把图像由粗糙变精致。每一层都有独自的CNN,由两个部分训练。一个是低分辨率图像,另一个是噪声矢量(这是传统GAN的唯一输入)。这就是多种输入的CGAN的原理。输出的图像会被作为样本再次输入给金字塔的下一层。这种方法很有效,因为每一层的生成器都能利用不同的分辨率信息,以在连续的层里合成更精细的图像。

深度学习研究总结:生成对抗网络(附 3 篇 arXiv 最火论文)-2 (诺亚方舟,人工智能,Twitter,龙泉寺,百度)

友荐云推荐




上一篇:产品设计思考:评论VS弹幕的差异
下一篇:BHS is now pureplay ecommerce: Will loyal customers move online?
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

eksw 发表于 2016-10-3 20:42:43
路过的帮顶
回复 支持 反对

使用道具 举报

李曼 发表于 2016-10-4 10:52:22
有节操!
回复 支持 反对

使用道具 举报

OKOK8811 发表于 2016-11-7 00:09:53
也许似乎大概是,然而未必不见得。
回复 支持 反对

使用道具 举报

snlvb 发表于 2016-11-7 07:36:49
我只是路过,不发表意见
回复 支持 反对

使用道具 举报

贾梅 发表于 2016-11-7 14:05:46
因为谦卑,所以高贵.因为懂得,所以慈悲;因为陌生,所以勇敢,因为距离,所以美丽.
回复 支持 反对

使用道具 举报

心刺爱人 发表于 2016-11-8 07:40:49
键盘下的忧伤涨姿势
回复 支持 反对

使用道具 举报

llllll234 发表于 2016-11-8 10:39:48
我就搞不明白了,看帖回帖能死人么,居然只有我这么认真的在回帖!
回复 支持 反对

使用道具 举报

DIDI-童装 发表于 2016-11-11 21:16:56
一楼招租,租金面议!100年起租。
回复 支持 反对

使用道具 举报

爱之绝缘体 发表于 2016-11-15 20:57:02
在神经的人群里呆久了,我发现我正常了。
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表