多中心值不同的服从正态分布 英文误差总和服从什么分布,为什么

【图文】随机误差_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
上传于||暂无简介
大小:1.23MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢君,已阅读到文档的结尾了呢~~
计量基础知识培训教材(可编辑),计量基础知识,计量基础知识讲座,计量经济学 教材..
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
计量基础知识培训教材(可编辑)
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口为什么正态分布在自然界如此常见?
按投票排序
对这个问题的研究,可以写好多本书,而且是还没有写出来,人类还不知道那种 :)需要修正一下你的看法,自然界最多的不是正态(高斯)分布,而是长尾(幂律等)分布。你可以搜索一下heavy tail, zipf law之类的关键词。事实上,高斯分布更常见于人造体,而非自然界。原因为啥,我下面讲。高斯分布怎么来的,很简单。只要你观察的系统里,各种对象之间关联很弱,那么他们的总和平均表现,根据中心极限定律,就是高斯或者近高斯的。你看我们人造的东西,很多都是模块化的,比如汽车轮船飞机,桌子椅子板凳,等等。我们人类造东西,都是“搭”出来的,一个模块和另一个模块之间关联很弱,坏了一个模块换掉就好。所以人造系统,其表现,包括性能啊,噪声啊,稳定度啊,都基于高斯分布。但自然界呢,假如有个造物主,它造东西跟人类的思路就很不一样。它手里的作品是“生长”出来的。比如我们人,从一个受精卵发育而来,各个部分强关联,受精卵上一点缺陷,会反映到整个人体的巨大影响。这和桌子有本质区别,就算桌子原始材料有个洞,也不可能造出来桌面和桌腿都很多洞。“生长”这个过程到底服从什么本质的数学规律,我们人类还不确切知道。从2000年以后,学界的研究集中于通过随机游动,扩散这样的动力学行为来对“生长”出来的系统(复杂系统)尝试寻找类似于模块系统的中心极限定律的总体规律。有一些进展,但是还没有特别令人信服的突破性结论。
这个问题很有趣。目前的答案中,我最赞同 的答案。自然界最常见的分布并非是正态分布。 的答案中提到的正态分布是最大熵的分布,这是对于封闭的系统而言存在概率最大的分布。他提到了熵增原理,也就是说,我们如果先默认熵增原理成立,那么必须假定系统是封闭系统。而最大熵的分布对于热力学系统而言,正是当系统处于热力学平衡态时的分布。他不是装逼,只是从物理的角度,假设一个理想的情况下,来考虑这个问题。然而自然界最常见的分布并非是正态分布,对于热力学语言之下,这是因为自然界大多数的系统都并不是完美的处于热力学平衡态的封闭系统。在数学的视角下,它们彼此之间不是独立的,而是存在错综复杂的相互作用,不适用中心极限定理。严格的来说,自然界几乎处处都是开放的、有各种相互作用的系统,还存在许多自组织系统,即那些可以从比较混乱的初始状态,仅仅是由其局域的动力学规则,演化成有规律的体系的系统。有更多的系统最多只能近似的、或局域(时间或空间意义下)的可以看做处于热力学平衡态,近似的看作其中的变量相互独立,或压根就不能那样考虑。比如说生物的细胞中,由DNA转录为RNA、再由RNA翻译为蛋白质,然后蛋白质与蛋白质发生相互作用,或可以调控转录,这样的过程,其copy number经常并不多,而其反应过程的特征能量又与常温下的随机热扰动的能量量级不相上下,所以可以想见,其涨落非常大。生物系统正是不断地从外界摄取能量,自组织的完成一定的功能,维持低熵状态的系统。它并不适用于用热力学平衡态的那套模型去研究,也不服从正态分布。 提到了Zipf's law,这样的分布在之前被认为是一个fine-tuning 的问题(fine-tuning 的问题我们通常认为是个问题),也就是说需要系统得到精确的调控,才可以实现。然而今年有篇PRL文章提出了一种可以由系统中的随机变量导致Zipf's law的具有一定普适性的机制,请看这篇文章:而生物系统这样的自然体系,在漫长的演化之后,还形成了一些比较好玩的规则。比如如果单从动力学网络结构的角度来看,生物系统对应的网络拓扑结构的熵总是比较低的。也就是说,不光从物理上,其系统的熵比较低,从这种非物理的、仅仅在动力学结构的意义上而言,它的熵也低。请参考这篇文章:所以说,你看,自然界其实是在不同的规则之下,有不同的机理,演化出不同的分布呢。目前为止,人们总是认为自然界里各种类似生物这样的系统是很复杂的,没有普遍规律,而要case by case讨论的系统,这么认为的生物学家、化学家非常多。而物理学家又往往更多的研究一些更理想的系统(经常不是自然界本身就符合的,比如真空中的球形鸡),倾向于去寻找更简单的、普适的规则。我不敢去评论谁对谁错,然而我总是期望着,如果哪一天我们对物理更了解,对数学更了解,也对生物、化学更了解,我们就能在更为普遍的意义下,去建立一套描述生物系统之类系统的数学语言。如果哪一天我们真的能够窥见自然界普遍存在的复杂系统的“牛顿三定律”,那么我们也许会开始惊叹自然界其实比我们想象的要聪(tou)明(lan)。
高斯分布的信息熵最大。即,高斯分布是最混乱系统。这里有个前提条件是方差一定,这个条件在物理学家的眼中可以意味着涨落,可以是统计学上的能量的涨落(比如maxwell速度矢量分布的方差是确定的kt/m),或者是不确定关系下的涨落。自然会趋向于最熵增和低能量态。这是热力学的最简单运行轨迹。个人认为比之中心极限定理,这个是更为本质的因素。就像我们可以证明出来牛顿力学基础上的经典力学,但是显然是更加优雅和接近自然本质的描述。==============================================抱歉之前手抖连哈密顿原理都打错了,谢谢各位指正,等赶完量子力学作业就过来补关于信息熵的内容。
为什么是限定均值和方差的正态分布呢,不是只限定均值的指数分布呢,或者不是一个很长很长的区间上的均匀分布呢?要知道至少有一打参数分布都能在给定的一些矩的限制条件下,成为对应的最大熵分布。用信息熵来解释正态分布的普遍性,在我看来是最有逼格但是最扯淡的解释。有人思考过对一阶矩和二阶矩的限制是自然的吗?严格正态分布(exact normal distribution)一般只会出现在理想的物理系统中,例如热力学系统中最大熵原理导致理想气体分子的速度服从正态分布。但是应该注意到,由于这种原因出现的正态随机变量应该是很少的。正态分布是误差理论的基石,我们实际生活中绝大部分情况下遇到的正态分布,都来源于大量随机变量的累加,而中心极限定理保证了这一切的和都会近似成一个正态分布。正态分布本身具有一个非常良好的形式,他是唯一的均值方差完全独立的二元分布。正态分布均值方差的独立性,在证明中心极限定理的时候会显现无疑。对随机变量正则化和的特征函数做taylor展开,在一定正则条件下,可以舍弃3阶以上的项,而保留下来的一阶矩和二阶项求极限刚好确定了一个标准正态分布。我觉得这么多人顶最大熵的答案,无非就是觉得逼格高而已,在知乎上颇为主流的CSEE的学生显然都学了信息论,而概率论一般是和数理统计一起煮了个大锅饭。考虑到我居然发现不少统计系本科毕业的学生,连中心极限定理和大数定理都分不清楚(其实我毕业的时候也分不清楚啊。。。捂脸跑开),我觉得应该加强理工科专业本科的概率论的学习,4个学分的概率论与数理统计完全不够用。当然有人可以争辩,误差的存在就是增加原本有序的信息的混乱程度,假设误差本身服从一个最大熵的分布是很自然的,如果你想到了这一点,你真的好聪明啊!来读phd吧~
为啥不能老老实实承认,我们还不知道
高斯随手写下了一个分布——高斯分布。上帝说,世间万物都要服从高斯分布,于是就有了我们的世界。
写期末论文写累了,过来答下题。这个学期学了一门叫做machine learning的课程,正态分布在这门课程中经常被使用。正态分布(normal distribution)又叫高斯分布( Gaussian distribution),在统计学中经常被使用到。1,n次独立观察中,观察误差满足正态分布。已知,误差分布导出的极大似然估计 = 算术平均值 (这个假设是高斯证明正态分布的形式的时候给出的,后来拉普拉斯根据central-limit theory,证明了这个假设。拉普拉斯的证明我没有看,所以不要细究这个)设真值为 θ, x1,?,xn为n次独立测量值, 每次测量的误差为ei=xi–θ,假设误差ei的密度函数为 f(e), 则测量值的联合概率为n个误差的联合概率,记为L(θ)=L(θ;x1,?,xn)=f(e1)?f(en)=f(x1-θ)?f(xn-θ)为求极大似然估计,令d logL(θ)dθ=0整理后可以得到∑i=1nf′(xi-θ)f(xi-θ)=0令 g(x)=f′(x)f(x),∑i=1ng(xi-θ)=0由于高斯假设极大似然估计的解就是算术平均 x?,把解代入上式,可以得到∑i=1ng(xi-x?)=0(1)(5)(1)式中取 n=2, 有g(x1-x?)+g(x2-x?)=0由于此时有 x1-x?=-(x2-x?), 并且 x1,x2 是任意的,由此得到g(-x)=-g(x)(1)式中再取 n=m+1, 并且要求 x1=?=xm=-x,xm+1=mx, 则有 x?=0, 并且∑i=1ng(xi-x?)=mg(-x)+g(mx)所以得到g(mx)=mg(x)而满足上式的唯一的连续函数就是 g(x)=cx, 从而进一步可以求解出f(x)=Mecx2由于f(x)是概率密度函数,把f(x) 正规化一下就得到均值为0的正态分布密度函数N(0,σ2)。上面这段证明源自恩斯(Edwin Thompson Jaynes) 的《概率论沉思录(Probability Theory: the Logic of Science)》,我只是搬运一下。下面先给出标题,有时间再填坑,先写论文去了。---------------------------------------------------------------------------------------------------------------------------------2.赫歇尔证明了在二维空间中误差分布满足Gaussian Distribution,麦克斯韦证明了三维空间中误差分布满足Gaussian Distribution3.自然界噪音的形成满足Gaussian Distribution,证明由英国工程师兰登(Vernon D. Landon)给出。4.正态分布使得信息熵(香农熵)最大5.由中心极限定理(central-limit theory),n个独立分布的随机变量,当n趋向于正无穷时,n?趋向于正态分布6.如果 X,Y 是独立的随机变量,且 S=X+Y 是正态分布,那么 X,Y 也是正态分布7.统计学三大分布χ2分布、t分布、F分布与正态分布有着密切的关系
我概率学的少,不过应该是因为中心极限定理吧
有没有人想过给自然界所有分布的出现频率计算一个分布(分布的分布),会不会那本身就是一个正态分布,而正态分布恰好处在自己的中心最大处?如果这样的话对这个问题的回答就颇具意味了,正态分布将自我解释为何如此普遍!
很多个因素独立同分布并且可以叠加,那么叠加结果就会接近正态分布。我看的参考书上把这个叫做中心极限定理。就是这样,自然中的结果都有很多原因,并且经常是独立的,可以叠加的,所以最终展现出来的结果就是正态分布。
Everyone believes in the normal law, the experimenters because they imagine that it is a mathematical theorem, and the mathematicians because they think it is an experimental fact(每个人都相信正态法则,实验人员是因为他们想象这是一个数学定理,而数学家则是因为他们认为这是一个实验事实).— 法国物理学家 Gabriel Lippmann (French physicist ,16 Aug 1845 - 13 Jul 1921), Conversation with Henri Poincaré. In Henri Poincaré, Calcul ds Probabilités (1896), 171来源:
因为研究概率论的学生的成绩都是正态分布的,所以他们看哪里都是正态分布的
最上的那位朋友已经从数学角度给予了解释,可谓“今外”的解释,那我就来一个补足版的“古中”的解释:)“喜怒哀乐之未发,谓之中。中也者,天下之大本也。和也者,天下之大道也。致中和,天地位焉,万物育焉。”“持而盈之,不如其已;揣而锐之,不可长保。金玉满堂,莫之能守;富贵而骄,自遗其咎。功成身退,天之道也。”“曲则全,枉则直,洼则盈,敝则新,少则得,多则惑。是以圣人抱一为天下式。不自见,故明;不自是,故彰,不自伐,故有功;不自矜,故长。夫唯不争,故天下莫能与之争。古之所谓"曲则全"者,岂虚言哉?诚全而归之。”类似的表达还有很多。正态就是常态,常态就是“抱一”。你看我们的老祖先们,早已看透正态分布的原理。生为中国人真幸运:)祝生活愉快。
这个问题写明白,可以拿N多诺贝尔奖。
在低统计的情况下,正太分布近似适用。要回答题主,只能说是因为日常情况下,近似描述已经足够了。真正需要精确描述的话,正太分布并不常用。
这个问题大概等价于为什么素数在自然界数域里分布密度趋向于x/lnx。小伙子,有时候我们需要认识世界,也只能认识世界。
抛开正态分布在数学专业的分析,我一直将其进行哲学思考:无论是类比传统文化中的福祸相依和中庸之道,还是经济学里面的橄榄球结构,正太分布图形都能够近乎完美的做出解释。所以,我会在我人生极点的时候
为什么学生成绩正态分布才是好卷子…
看到这么多人用中心极限定律解释正态分布,感觉很无语。中心极限定理不过是通过不断累积随机变化去增加一个分布的熵,所以它的最终的结果自然是逼近高斯分布。和@徐浩浩 的答案比较一致,高斯分布就是一个简单的最大熵分布,这个分布是表述在线性空间里的,包括高维的线性空间,比如multi-variate normal distribution在其他空间比如角度空间,我们还能找到如von Mises分布这样的最大熵分布模型 (cited from wikipedia)。如果我乐意,我可以在任何一个域找到一个最大熵分布模型,比如用一个泛化的Bingham分布模型。原理就是,如果我们对一个分布观测不到特别的分布趋势(skew),那么用max entropy模型就是最稳定的(因为entropy已然是最大了)。所以反过来,如果我们对一个分布趋势的观测能看到明显的skewness,那自然这个分布就可以用熵值更小的模型来描述了。
对系统内熵取极值可以直接导出正态分布密度函数。所以这是上帝扔出的骰子所应符合的分布。
已有帐号?
社交帐号登录
无法登录?
社交帐号登录第二章 误差分布(2)_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
第二章 误差分布(2)
上传于||暂无简介
大小:1.09MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢解正态分布题测是距离时产生的随机误差X(单位:m)服从正态分布N(20,1600),进行3次独立测量,求:(1)至少有一次误差绝对值不超过30m的概率:(2)只有一次误差绝对值不超过30m的概率.
_末家男人丶僸
设误差绝对值不超过30m的为事件A,F(X)为概率分布函数P(A)=F(30)-F(-30)=Φ[(30-20)/40]-Φ[(-30-20)/40]=Φ(0.25)-Φ(-1.25) 具体数值你就自己查表吧(1)设所求事件为BP(B)=1- [1-P(A)]^3(2)设所求事件为CP(C)=3*P(A)*[1-P(A)]^2
为您推荐:
其他类似问题
扫描下载二维码}

我要回帖

更多关于 误差项不服从正态分布 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信