产品设计

    今日:94| 主题:15669
收藏本版 (1)
软件产品、PC、移动、网站、平台的开发、策划等内容。

[其他] 【WEEX外汇学堂】浅谈贝叶斯分析

[复制链接]
男的也很單純 发表于 2016-10-8 22:14:15
116 3

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
贝叶斯分析是整个机器学习的基础框架。首先从贝叶斯统计说起。
  先谈概率。概率大家都很熟悉。然而说到定义却不一定说对,中学课本会说,概率是一件事发生的频率。
  而贝叶斯框架下的概率理论却给了另一个角度:概率是我们的主观概念, 表明我们对某个事物发生的相信程度。 如Pierre Lapalace所说: Probability theory is nothing but common sense reduced to calculation.  这正是贝叶斯派的核心。它解决的是来自外部的信息与我们大脑内信念的交互关系。
  两种对于概率的解读区别了频率流派和贝叶斯流派。如果不理解主观概率,也就无法理解贝叶斯定律的核心思想。
  ——贝叶斯分析居然能解决家庭纠纷?

  来看一个有趣的案例:假如你是女生, 在你的老公包里发现了别的女人内裤,那他出轨的概率是多少。
  稍微熟悉这个问题的人会知道,做这个题目你要先考察基率。你要把这个问题分解为几步考虑:
  1.你老公在没有任何事件情况下出轨的概率是多少? 如果他是个天生老实的IT或者风流倜傥的CEO, 显然不该一视同仁。
  2.如你老公出轨了, 那么藏一条内裤的概率是多少; 如果他没出轨, 出现这个情况概率有多少?  想想一般人即使出轨也不会那么傻, 会不会有没出轨而出现内裤的状况? 有没有可能是某个暗恋你老公的人陷害?
  3.根据1和2求解,这才是拥有大学数学能力的人该做的。
  在这里1其实就是先验概率P(A),而2是条件概率P(B|A), 最终得到3后验概率P(A|B)。这三种即是贝叶斯统计的三要素。基于条件概率的贝叶斯定律数学方程极为简单:
  

【WEEX外汇学堂】浅谈贝叶斯分析-1 (老公出轨,nothing,女人内裤,common,课本)

  A即出轨, B是内裤出现, 你得到1,2,就可以根据公式算出,根据内裤出现判断出轨的概率。
  先验概率在贝叶斯统计中有重要意义,首先先验概率即我们在取得证据之前所指定的概率P(A), 这个值通常是根据我们之前的常识,带有一定的主观色彩。 就像刚刚说的出轨的问题, 你的先验概率代表了你对丈夫的信心。
  有一个非常有趣的现象是,如果我们的先验概率审定为1或0(即肯定或否定某件事发生), 那,无论如何增加证据,也依然得到同样的条件概率(此时P(A)=0 或 1 , P(A|B)= 0或1) 。这告诉我们一个经验:不要过早的下论断, 下了论断你的预测也就无法进化了。 你如果想让认知进步,就要给各种假设留空间。
  ——贝叶斯分析看辛普森案

  贝叶斯分析的思路,对于由证据的积累来推测一个事物发生的概率具有重大作用。当我们要预测一个事物, 首先根据已有的经验和知识推断一个先验概率, 然后在新证据不断积累的情况下调整这个概率。整个通过积累证据来得到一个事件发生概率的过程,我们称为贝叶斯分析。
  贝叶斯分析中的三要素在不同的问题中通常有侧重点 。 很多时候,都是忽略先验概率的作用,比如描述一个人很书呆子气让你判断他是大学老师还是销售员的经典案例(要看先验大学老师还是销售员哪个多啊)。
  但是有时,我们也不理解条件概率, 比如著名的辛普森案。为证明辛普森有杀妻之罪,检方说辛普森之前家暴。辩护律师说,美国有400万女性被丈夫或男友打过,其中只有1432人被杀,概率是2800分之一。
  这其实就是误用了后验概率。这里的条件是“被杀”而且“有家暴”,而要推测的事件是“凶手是男友”(事实上概率高达90%),这才是贝叶斯分析的正当用法, 而辩护律师却把完全在混淆条件与要验证的假设。
   理解贝叶斯分析最好的方法即 图像法 , 这里的A的面积即先验, 后验是阴影占篮圈的百分比。
  


【WEEX外汇学堂】浅谈贝叶斯分析-2 (老公出轨,nothing,女人内裤,common,课本)

  贝叶斯分析,可以瞬间理解一些常用的理论, 如幸存者偏差。你发现一些没读过书的人很有钱,事实上是你发现就已经是幸存者了(对应上图中小红圈), 而死了的人(红圈外的大部分面积)你都没见到啊。
  还有阴谋论——阴谋论的特点是条件很多很复杂, 但是条件一旦成立,结论几乎成立,你一旦考虑了先验,这些条件成立本身即很困难, 阴谋论不攻自克。
  图上红圈和篮圈的面积, 很少我们在开始就知道, 这才是应用中的难点。
  此处,贝叶斯分析的框架也在教我们如何处理特例与一般常识的规律。
  如果你太注重特例(即不看先验概率) ,很有可能会误把噪声看做信号。

  如果恪守先验概率, 就成为无视变化而墨守成规的人。其实只有贝叶斯派的人生存率会更高, 因为他们会重视特例, 但也不忘记书本的经验,根据贝叶斯公式小心调整信心,甚至会主动设计实验根据信号判断假设,这就是我们下一步要讲的。
   —— 贝叶斯决策判定男女
   在刚刚讲到的贝叶斯统计分析的基础上, 我们就可以引出一个更核心的概念, 贝叶斯决策
   贝叶斯决策主要包含 四个部分 :  数据(D) ,  假设(W)目标(O)决策(S) 。 此处数据即之前讲到的证据。假设是我们要验证的事实,目标是我们最终要取得优化的量,决策时根据目标得到的最后行为。与上一步贝叶斯分析增加的部分是目标和决策。假设在问题里如果是连续的往往以参数空间的形式表达。
  然后我们可以按照如下步骤做:
  
       
  • 1.理清因果链条,哪个是假设,哪个是证据   
  • 2.给出所有可能假设,即假设空间   
  • 3.给出先验概率   
  • 4.根据贝叶斯概率公式求解后验概率, 得到假设空间的后验概率分布   
  • 5.利用后验概率求解条件期望, 得到条件期望最大值对应的行为  
   贝叶斯决策如果一旦变成自动化的计算机算法, 它就是机器学习。Ok, 此处应有掌声,我们就用贝叶斯决策诠释一个 最简单的机器学习分类算法—— 朴素贝叶斯
  假设给你一个人的身高和体重资料,你不知道他的男女性别, 你可以通过我上述给出的贝叶斯决策机制解决这个问题:
  首先, 此处我们的证据是身高和体重, 假设是男或女。先验概率是人口中的男女比例, 而我们需要掌握的条件概率是男性和女性的身高和体重分布,这应该是很好掌握的信息。
  然后我们可以根据贝叶斯公式求解后验概率,而此处我们要做的决策时男女,目标是分类错误率最低,决策即性别分类。
  此处我们用到一个基本假设就是证据是互相独立的, 使我们能够求得更简单的公式:
  

12345下一页
友荐云推荐




上一篇:20 Beautiful and Free Hand-Drawn Fonts
下一篇:移动APP可用性测试:实验室测试和现场测试的比较(上)
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

霖珺金 发表于 2016-10-10 02:10:40
楼主,约么?
回复 支持 反对

使用道具 举报

lxl25258 发表于 2016-10-10 04:02:57
我对楼主的敬仰犹如滔滔江水绵延不绝!
回复 支持 反对

使用道具 举报

青川地震 发表于 2016-11-18 10:11:41
男的也很單純日后必成大器!
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表