手机版 欢迎访问人人都是自媒体网站
我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。作者详细阐述了如何进行假设检验,分享给大家。
我们为什么要假设检验?
我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。
举一个简单的例子:
学而思网校App进行了改版迭代,现在有以下两个版本:
版本1:首页为一屏课程列表 ;
版本2:首页为信息流。
如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。
我们就需要对总体(全部用户)进行评估,但是并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。
假设检验定义假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
假设检验的假设由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。
所以做假设检验时会设置两个假设:
一种叫原假设,也叫零假设,用H0表示。原假设一般是统计者想要拒绝的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。
另外一种叫备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。
例子在进行假设检验时,我们希望接受版本2的假设,想拒绝接受版本1的假设。所以我们的假设设置为:H0 :μ版本1 >= μ版本2 ,H1 : μ版本1 < μ版本2。
为什么统计者想要拒绝的假设放在原假设呢?
因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。
有点看不懂哈?没关系,我们讲一下假设检验中的两种错误和显著性水平就清楚了。
两种错误:弃真错误、取伪错误我们通过样本数据来判断总体参数的假设是否成立,但样本时随机的,因而有可能出现小概率的错误。这种错误分两种,一种是弃真错误,另一种是取伪错误。
弃真错误也叫第I类错误或α错误:它是指原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小。
取伪错误也叫第II类错误或β错误:它是指原假设实际上假的,但通过样本估计总体后,接受了原假设。明显者是错误的,我们接受的原假设实际上是假的,所以叫取伪错误,这个错误的概率我们记为β。
现在清楚原假设一般都是想要拒绝的假设了么?
因为原假设备被拒绝,如果出错的话,只能犯弃真错误,而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制,将错误影响降到最小。
显著性水平显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。
显著性水平α越小,犯第I类错误的概率自然越小,一般取值:0.01、0.05、0.1等。
当给定了检验的显著水平a=0.05时,进行双侧检验的Z值为1.96。
当给定了检验的显著水平a=0.01时,进行双侧检验的Z值为2.58。
当给定了检验的显著水平a=0.05时,进行单侧检验的Z值为1.645。
当给定了检验的显著水平a=0.01时,进行单侧检验的Z值为2.33。
检验方式检验方式分为两种:双侧检验和单侧检验。单侧检验又分为两种:左侧检验和右侧检验。
双侧检验:备择假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验
单侧检验:备择假设带有特定的方向性 形式为”>””<“的假设检验,称为单侧检验 “<“称为左侧检验 “>”称为右侧检验
检验统计量:据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
拒绝域:拒绝域是由显著性水平围成的区域。
Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP