总统列

贝叶斯初学者2:前

c·格里斯泰尔兰迪

2015年9月30日

标签:

在他的就职总统列格里斯泰尔APS总统c·兰迪,向初学者介绍贝叶斯统计分析。这个月,他继续介绍贝叶斯与一个教训在利用先验分布改善参数估计。

在上个月的专栏中,我关注的可能性和概率之间的区别。

审查,概率高度可能的结果从一个随机的过程就像掷硬币(技术上称为伯努利过程)。一个概率分布给出了不同的可能结果的概率给定的参数的过程。假设我们有50%的机会(即成功。,抛头;p= 5)和告知有10次。鉴于这些参数,准确的概率5个正面时抛一枚硬币大约为10倍。

相比之下,可能连接到我们的参数估计和假设。例如,鉴于我们发现9 10次的一枚硬币,的可能性(即抛头的概率是50%。,这p= 5)非常低。的可能性p=。9大的近40倍。似然函数告诉我们可能值的相对可能不同p。

两个组件的似然函数只有一个贝叶斯计算,然而。另一个是之前,这是必要的估计参数,得出统计结论。使用先验分布改善参数估计和量化的假设。

一个先验分布可以而且应该考虑一个已经知道的东西。然而,当人知道很少,可以使用先知先觉的杰弗里斯杰弗里斯,英国数学家命名哈罗德爵士,他恢复了贝叶斯概率的观点。先知先觉的杰弗里斯是一些最有趣的和有用的先验分布,他们来自毫无了解的数学意义以外的人想要估计的参数可能的范围。

改善前的参数估计

Pres_Column2 一个先验分布概率赋值给每一个可能的值的每个参数估计。因此,当估计参数的伯努利方程的过程p之前,是一个可能的值的分布p。假设p的概率是一个主题做了x假设我们最初不知道多少人有这种实践。我们问前三个主题是否他们已经做了。他们都说,“没有。“在这个早期阶段,我们的人口比例应该估计做了X ?以及我们应该对我们的估计吗?

数据本身p(X) = 0。这个值指定了一个分布无差异;它预测每一个后续的主题还没有做x直觉认为这是不明智的三个人作为代表的经验所有人们的经验。然而,手头的数据,给我们一些信息:我们已经知道p(X)≠1(因为至少一个主题没有X),这似乎不太可能p(X) >。9(因为我们的三个主题做了X)。

贝叶斯参数估计借口,量化这些直觉将先验分布计算。先验分布代表不确定性参数的值之前,我们看到的数据。杰弗里斯意识到任何了解其可能的范围以外的一个参数(在本例中,0 - 1)经常唯一指定了一个先验分布参数的估计。

杰佛利之前的p伯努利过程的参数称为贝塔分布。贝塔分布本身有两个参数,表示a和b。杰弗里斯之前,这些值a = b = 0。5。常见的做法后,我把这些参数hyperparameters区分它们的参数分布,我们试图估计。

通过采用一个杰佛利之前,我们可以计算的最佳估计p我们当前的不确定性和量化p在数据采集的每个阶段,从阶段我们没有数据阶段,我们有一个n在数百万。贝叶斯计算需要用先验分布的似然函数和正常化的结果为了获得后验分布(即。,一个新的不同的值的概率分布p,考虑到数据和之前)。这个过程听起来很吓人。

然而,当我们使用之前的主人公,以相同的形式为后验分布的先验分布;一个β分布在之前和贝塔分布出现后。(被称为先验分布与这美好的属性共轭之前)。因此,计算是唯一改变贝塔分布的参数的值。此外,新值的计算这些参数非常简单:a_帖子=一个_之前+n_年代和b_帖子= b_之前+n_f,在那里n_年代表示成功的数量(在这种情况下,那些做了X)n_f失败的数量(受试者没有)。最好的估计p后验分布的均值,是a_帖子/ (_帖子+ b_帖子)。统计计算从来没有比这更容易。

最重要的是,由此产生的后验分布告诉我们如何确定我们应该的真正价值p。在传统的统计,这是置信区间应该做什么。(它很糟糕,但这是另一个故事。)估计的估计的置信区间p当样本低并非易事,而后使用共轭先验分布的计算,已经解释,简单本身。

图1块的似然函数,杰弗里斯之前,后验分布的情况我们没有三阴性和阳性。注意好贝叶斯统计可以捕捉我们的直觉告诉我们我们可以从这个小样本学习。

bdapp官网下载 >2015年 >10月 >贝叶斯初学者2:前

关于作者

c·格里斯泰尔兰迪尊敬的罗格斯大学的心理学教授。州使用动物模型来研究学习和记忆。他是一个APS威廉·詹姆斯的家伙,美国国家科学院的一员,和收件人沃伦奖章的社会实验心理学家。从2001年到2004年,州担任Member-at-Large APS董事会。可以通过gallistel@psychologicalscience.org联系他。

职业近距离:乔尔·安德森在性别和性别偏见、自由的学术研究,合作的重要性

乔尔·安德森,高级研究员澳大利亚天主教大学、拉筹伯大学,研究组织流程、利息与特定的偏见,偏见和刻板印象。

实验方法并不是中立的工具

极其安娜索菲亚和拉尔夫Hertwig解释实验心理学家画过于消极人类理性的照片,以及他们的悲观情绪是根植于一个看似平凡的细节:方法论的选择。

APS研究员9月

此外,APS新星接收社会早期的研究员奖。

布鲁克大学

SSHRC二级加拿大社会心理学研究的椅子

W的菲利普斯 2015年10月1日

州正确指出概率推断基于新的数据应该考虑一个已经知道。的数学基础和实际后果是最彻底的统计物理学家建立的埃德温·T我们(2003),基于贝叶斯和杰佛利但走得更远。理解概率推理及其神经基础是至关重要的,有两种截然不同的和补充知识的方式可以考虑。最明显和最著名的方式是通过独立的先验概率推理计算的新数据,即通过所谓的前。至少另一种方法是同样重要的,即通过的可能性。相比之前的计算,计算这取决于知道新数据,并可以敏感的上下文信息知识,既无必要,也足够的计算后验,但,如果可行的话,可以有很大的可能对计算的影响。考虑一个模糊输入的可能的解释。其中的一些解释除了在某些情况下,可能是不太可能。因此,而先知先觉的概率可以指定每个解释平均超过所有上下文,可能可以用来选择后验的概率大大增加,尽管不太可能总体而言,极有可能在当前上下文。很可能是知识的角色在决定可能终于在确定先验一样根本性的作用。

茱莉亚Heberle 2015年10月12日

你好兰迪,
感谢这两列!我在想如果你可能自己,或问别人,第三个在这个伟大的系列。我希望看到一个数据集或研究的角度讨论如何通过不同数据分析类零假设方法和贝叶斯分析。我几乎可以理解这两列中提供的各种各样的例子,但我想我(或者其他)将大大受益于并排对比,如果这是可能的吗?
谢谢你！
茱莉亚

Eric Garr 2016年8月20日

情节之前,显示了主人公,迷惑我,因为我觉得概率密度函数只能马克斯在1。

格里斯泰尔C.R. 2016年9月30日

应对Eric Garr:概率不能大于1,但概率密度可以有任何值从0到+∞。概率分布的概率密度应用持续的支持,如持续时间或利率。概率密度的价值在任何时候(任何支持值)是累积概率分布的导数。换句话说,它是概率增加的速度。如果所有的概率是集中在一个点,就像在一个预测p =零假设。5,那么概率增加的速度是无限的

APS定期打开特定的在线文章讨论在我们的网站上。有效的2021年2月,你必须登录APS成员发表评论。通过发布评论,你同意我们社区指导原则和显示您的个人信息,包括你的名字和联系。任何意见、发现、结论或建议在文章评论的作家和不一定反映APS的观点或文章的作者。有关更多信息,请参阅我们的社区指导原则。

请登录你的APS账户置评。

饼干	持续时间	描述
兰德公司的	从来没有	AddThis集这个cookie来跟踪页面访问,流量来源和分享。
同意	2年	YouTube集饼干通过嵌入YouTube视频和寄存器匿名统计数据。
短波紫外线	1年27天	由addthis.com来确定使用addthis.com的服务。
_ga	2年	_ga饼干,安装谷歌分析,计算访客,会议和活动数据和跟踪网站的网站使用情况分析报告。cookie存储信息匿名和分配一个随机生成的数字识别独特的游客。
_gat_gtag_UA_3507334_1	1分钟	由谷歌来区分用户。
_gid	1天	安装谷歌分析,_gid饼干店游客如何使用网站信息,同时创建一个网站的性能分析报告。收集的数据包括游客的数量,他们的来源,他们匿名访问的页面。

饼干	持续时间	描述
疯狂的	1年27天	AddThis集这个地理位置cookie来帮助理解用户的位置信息分享。
VISITOR_INFO1_LIVE	5个月27天	规定一个cookie YouTube测量带宽决定用户是否得到了新老玩家界面。
YSC	会话	YSC饼干由Youtube,用来跟踪嵌入Youtube上的视频页面的观点。
yt-remote-connected-devices	从来没有	YouTube集此cookie存储用户的视频偏好使用嵌入YouTube视频。
yt-remote-device-id	从来没有	YouTube集此cookie存储用户的视频偏好使用嵌入YouTube视频。
yt.innertube: nextId	从来没有	这个饼干,由YouTube,注册一个惟一的ID存储数据与YouTube视频用户看到。
yt.innertube:请求	从来没有	这个饼干,由YouTube,注册一个惟一的ID存储数据与YouTube视频用户看到。