P值又叫概率值,是让科学家验证猜想是否成功的一个数值。这个值和显著性水平有直接关系,后者是验证科学研究的数据是否有统计上的显著性的重要指标。可以画个表,在计算其他统计值以后来找出P值。卡方是其中要先找出的统计值之一。 ## 步骤 ### 1 计算卡方,比较两组数据。 表达式是: (|o-e|-.05)^2/e 。o是观察数据或实际数据,e是期望值。比如要验证“红车司机比蓝车司机要更容易得超速罚单”。 要按过去的研究调查来决定期望值。比如,你过去发现红车得罚单的几率是蓝车的两倍,所以在总数150的数据假设中,你期望的是100辆红车得罚单,50辆蓝车得罚单。 用卡方式。由于观察到90辆红车、60辆蓝车得罚单,得出卡方为2.970075。 ### 2 决定数据自由度。 自由度是研究中涉及的变量个数,变量个数受到总类别数的限制。 这里例子中自由度是1,因为卡方中自由度= n-1,n就是数据类别数(两种不同的车,红的和蓝的。) ### 3 选择显著度。 显著度由你决定,一般定为0.05,或5%。这表示5%的总时间内研究结果会因为完全随机而偏离你的猜想,而剩余95%的时间内都符合你的猜想。 这个例子里,5%时间内会数据因为完全随机而偏离猜想,95%时间内的结果都符合你的猜想。 ### 4 用一个卡方分布表来找到P值。 卡方分布表会基于自由度和卡方值给出你的P值。这个表在网上或统计教科书中都有。不是所有卡方值都在分布表上有,所以找出最接近你卡方值的卡方值吧。 例子中卡方值是 2.970075。按照表中信息,P值是 0.10。因此样本研究不会显著偏于期望值,因此不能证明“红车拿罚单比蓝车拿得多”的猜想是假的。