什么是标准差(标准差与标准误怎么区分?(一))

什么是标准差
欢迎点击上方蓝字?“丁点帮你”?关注我们!这几天我们开始讲解t检验,其中有一个概念我们没有重点强调,有小伙伴在后台私信问了一下,所以,觉得还是有必要再做一下澄清,毕竟,后续还是会经常遇到。这个让同学们,尤其是初学者难以理解的概念就是标准误!什么叫标准误?它与标准差有什么区别?针对这两个问题,我们准备出一个小系列,给大家彻底讲清这个问题,今天是第一篇。据说,之前有统计学教科书在讲到“标准误”时,写下了这样一句话——“样本均数的标准误是样本均数的标准差”!是的,你没有看错,就是这样写的——“样本均数的标准误是样本均数的标准差”!对此,有人表示很“无语”。但可气的是,这句让人“无语”的话却是完全正确的。这又是为什么呢?从数学计算上看,标准差与标准误确实是一个东西,都是和一个均数做差,平方加和后取平均,再开方。但为什么称呼不一样?关键在于,它们所针对的对象不一样,标准差是针对一次抽样的原始数据而言的;而标准误是针对多次抽样的样本均数而言的。这里大家需要首先明确的是,不是只有样本均数才有标准误之说,所有通过抽样获取的统计量都可以计算标准误,这点我们后面再详述。其次,要指出的是,为什么我们这里在谈均数的时候,总是把“样本”两个字带上?因为,样本均数和均数(一般是总体均数的简称),在统计学上有很大的区别,样本均数是随着抽样而变化的,它是一个变量;而总体均数,虽然未知,但它只有一个,是不变的。比如,我们经常讲的一个例子,如果想要检验某个地区的成年男性的人均身高是否是1.75m,怎么做呢?可以从这个地区的人群中随机抽样调查1000名成年男子,计算这1000名男子身高的样本均数和样本标准差,进行假设检验,看是否拒绝总体均数等于1.75的假设,这就是大家最熟悉的单样本t检验。此处需要提醒的是,在进行假设检验时,我们的关注点在样本均数上,即我们不太关注原始数据的情况,而是关注由这个样本计算的样本均值。现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名名字(总研究对象是10万,分为100个样本),所以,我们会得到100个样本均数,将这100个样本均数放在一起再求平均数和标准差,而这个标准差就是我们说的“标准误”。理清了这个过程,再来看这句话——“样本均数的标准误是样本均数的标准差”是不是就能理解了呢?用互联网的语言,可以将“标准误”理解成“经过二次迭代的标准差”,也就是说,标准差是针对最原始变量的(即本例中的身高);而标准误是针对样本均数的(即本例中的身高的样本均数)。所以,就计算而言,标准差和标准误没有区别,好比我们将一组样本的原始身高值用来表示,其样本均数一般用表示,如果现在我们不用表示,而用字母表示,设那么此时对求标准差的过程不就和没啥区别了吗?只是换了变量而已,由变成了。因此,把样本均数作为一个(新)变量来看,就会明白标准误和标准差其实没有本质的区别。当然,这两者在统计学意义上还是可以做一个区分的,这一点我们下文再谈。欢迎关注公众号“丁点帮你”!推荐阅读t检验合集,含SPSS完整演示视频T检验和其他假设检验的P值怎么理解《讲透统计》系列文章合集丁点帮你
欢迎扫描下方二维码关注我们的微信公众号“丁点帮你”,获取更多精彩。“丁点帮你”是由毕业于北京大学的丁小丁和丁小点共同创立的,旨在搭建一个知识分享和一对一咨询平台。希望通过我们的努力,给大家分享有价值的观点和知识,同时让您的问题得到及时的、有针对性的回答。
欢迎交流,欢迎投稿!
觉得有收获?点个“赞”或“在看”再走吧!

版权声明