网络科技

    今日:1177| 主题:245562
收藏本版
互联网、科技极客的综合动态。

[其他] 图解LSTM神经网络架构及其11种变体(附论文)

[复制链接]
蒜你狠 发表于 2016-10-16 16:42:01
166 1

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
来源:机器之心
    参与:老红、李亚洲  原文链接: 图解LSTM神经网络架构及其11种变体(附论文)  本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载
  就像雨季后非洲大草原许多野生溪流分化成的湖泊和水洼,深度学习已经分化成了各种不同的专门架构。
  并且,每个架构都会有一个图解,这里将详细介绍它们。
  神经网络在概念上很简单,并且它们十分动人。在层级上,有着一堆同质化的元素和统一的单位,并且它们之间还存在在一系列的加权连接。这就是神经网络的所有,至少从理论上来说是这样。然而,时间证明的结果却有所不同。并非工程的特性,我们现在拥有的是建筑工程,而非工程的特性,正如 Stephen Merrity 描述的那样:
  深度学习的浪漫主义描述通常预示着手工制作工程特性的日子一去不复返了,这个模型的本身是足以先进到能够解决问题的。正如大多数广告一样,它同时具备真实性和误导性。
  虽然深度学习在很多情况下简化了工程特性,但它肯定还没有彻底地摆脱它。随着工程特性的减少,机器学习模型本身的结构变得越来越复杂。大多数时候,这些模型架构会特定于一个给定的任务,就像过去的工程特性那样。
  需要澄清一下的是,这仍然是很重要的一步。结构工程要比工程特性更具一般性,并且提供了许多新的机会。正如我们提到的,我们不能无视这样一个事实:我们离我们想要达到的还很远。
  LSTM 图解

  怎样解释这些架构?自然地,我们可以通过图解,图解往往可以让阐述变得更清晰。
  让我们先来看看如今最流行的两种网络,CNN 和 LSTM:
   
图解LSTM神经网络架构及其11种变体(附论文)-1 (Stephen,浪漫主义,建筑工程,李亚洲,大草原)

  很简单吧,我们再更仔细地研究下:

图解LSTM神经网络架构及其11种变体(附论文)-2 (Stephen,浪漫主义,建筑工程,李亚洲,大草原)

  正如大家所言,你可能有很多不理解的数学问题,但你会慢慢习惯它们。幸运地是,我们有很多非常好的解释。
  仍觉得 LSTM 太复杂了?那让我们来试试简单的版本,GRU (Gated Recurrent Unit),相当琐碎。
友荐云推荐




上一篇:知乎日报 demo 基于 Vue.js 2.0 支持服务端渲染
下一篇:如果你喜欢DIY灯具,Kavo是一个不错的开始
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

邓思源 发表于 2016-10-16 17:35:41
边撸边过
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表