三、數據資料的分析——假設檢驗
2024-08-14 20:41:05
作者: 王彩鳳 莊建東
根據樣本所提供的信息,運用概率的理論進行分析、論證,在一定可靠程度上對總體分布特徵進行估計、推測,這種統計方法稱為推斷統計。推斷統計的內容包括總體參數估計和假設檢驗兩部分,其目的在於根據已知的情況,在一定概率意義上估計、推斷未知的情況。總體參數估計可參閱王孝玲著《教育統計學》第六章,該書主要討論假設檢驗。
(一)假設檢驗的概述
假設檢驗是為了確定統計量的差異是什麼原因引起的。有兩種原因可引起統計量的差異:一種是由於它們來自兩個不同的總體,統計量之間的差異是兩個總體的差異;另一種是由抽樣誤差引起的,不是本質的差異。
在一般的教育科學研究中,研究人員獲得了樣本的相關信息,但真正關心的是能否通過研究樣本間的差異,推斷到總體間的差異。假設檢驗就是根據一定的概率,通過建立假設,並根據已知條件驗證假設的真假,從而由樣本的差異推論總體差異的過程。如假設為研究兩個城市大班幼兒創造性思維發展的差異情況,在兩城市分別隨機抽取了一定數量的樣本進行測試,並得到了測試成績的平均數和標準差。那麼該研究就是要根據一定的概率,通過建立假設,並根據兩個樣本的平均數、標準差等,來驗證假設的真假,從而由樣本的差異推斷總體間(兩個城市大班幼兒創造性思維發展)的差異情況。
假設檢驗是在建立假設的基礎上進行的,沒有假設,就沒有假設檢驗。假設一般有兩種,即虛無假設(又稱零假設)(H0)和研究假設(又稱備擇假設)(H1)。虛無假設是關於當前樣本所屬的總體與假設總體無區別的假設,即認為兩者之間沒有差異。研究假設是在假設檢驗前,研究者根據有關理論和已有的經驗,或者是根據對總體和樣本的了解,對研究結果預先作出的一個大致的假設,是研究者希望證實的假設。
假設檢驗的基本思想是運用「反證法」進行的推理,即通過檢驗H0的真偽來反證H1的真偽:證實了虛無假設的真,研究假設就為假;證實了虛無假設的假,研究假設就為真。
統計學上把拒絕虛無假設的概率稱為顯著性水平。一般常用的顯著性水平有兩種:一種是以概率等於或小於0.05的事件作為小概率事件;一種是以概率等於或小於0.01的事件作為小概率事件,用p≤0.05,p≤0.01表示。根據p值的大小,判斷假設H0成立與否,從而判斷出樣本與總體參數之間的差異性程度。表11-5是根據p值推斷假設檢驗的規則。
表11-5 統計學意義上的假設檢驗推斷規則
平均數的差異顯著性檢驗是常用的參數檢驗方法,分兩種情況。
一是關於樣本平均數與總體平均數差異的顯著性檢驗:在大樣本前提下(樣本總數超過30個),且總體服從正態分布,總體方差已知的情況下,用Z檢驗;而在小樣本前提下,總體方差未知的情況下,則用T檢驗。
二是關於兩組樣本平均數差異的顯著性檢驗,如兩個總體都服從正態分布,總體方差已知的情況下,用Z檢驗;而在總體方差未知的前提下,用T檢驗。
方差及方差差異的顯著性檢驗也分為兩種情況:一是樣本方差與總體方差差異的檢驗,用卡方檢驗(Χ2檢驗)。二是兩個樣本方差差異性的檢驗,用F檢驗。
計數資料的統計檢驗主要用Χ2檢驗,可以用來同時檢驗一個因素的兩項或多項分類的實際觀測數據,與某理論次數分布是否一致的問題,或有無顯著性差異的問題;還可以用於檢驗兩個或兩個以上因素的各項分類之間,是否有關聯或是否具有獨立性問題。
(二)Z檢驗和T檢驗(平均數差異的顯著性檢驗)
1.平均數差異的顯著性檢驗
(1)平均數差異的顯著性檢驗是研究兩個平均數的差異是否顯著的問題,包括兩種情況:
(2)教育科學研究中Z檢驗和T檢驗常用來進行平均數差異的顯著性檢驗,但因兩者是基於不同的統計分布原理進行的檢驗,因此各自適用的條件有所不同,簡單來說,Z檢驗一般是對大樣本平均數差異的顯著性檢驗,T檢驗是對小樣本平均數差異的顯著性檢驗。應用時請務必明確各統計檢驗方法及公式的使用條件!
上述兩種統計檢驗的步驟基本類似,具體如下。
①建立虛無假設(根據檢驗的要求有下列幾種)。
H0:μ1=μ2——雙側檢驗
H0:μ1 ≥μ2或μ1≤μ2——單側檢驗
選擇雙側還是單側檢驗,是由研究假設決定的,當只想檢驗參數是否有差異而不考慮方向時,用雙側檢驗,當須知道兩個參數誰大誰小時,用單側檢驗。
②計算統計量。根據數據資料的特點及研究需要,選擇適當的公式代入相關數據進行計算。
③確定顯著性水平並查表得出相關統計量的臨界值。α的值,在教育科學研究中一般取0.05或0.01。當α=0.05時,Z檢驗的臨界值查Z分布表後得知為1.96;當α=0.01時,臨界值為2.58(均為雙側檢驗,單側檢驗的臨界值也可查表得知)。而T檢驗的臨界值因受自由度df的影響,事先無法給出,具體應在自由度計算出後,再查T分布表。(自由度df是指任何變量中可以自由變化的數目,df一般為n-1)
④進行統計決斷,詳見表11-6。
表11-6 Z檢驗和T檢驗的統計決斷對比表
2.Z檢驗
Z檢驗在教育科研中常用它來進行大樣本(n≥30)平均數差異的顯著性檢驗,根據具體條件的不同,可分別應用以下公式來計算。
(1)單總體Z檢驗。
單總體Z檢驗是對一個樣本平均數與一個已知的總體平均數的差異是否顯著的檢驗。
其檢驗所使用的統計量公式如下表11-7所示。
表11-7 單總體Z檢驗的公式
(2)雙總體Z檢驗。
雙總體Z檢驗是對兩個樣本平均數所來自的兩個總體的平均數差異是否顯著檢驗。雙總體Z檢驗主要適用於兩個獨立大樣本(n1≥30,n2≥30)平均數差異的顯著性檢驗。獨立樣本是指兩樣本來自兩個沒有關係的總體。其計算統計量的公式如表11-8所示。
表11-8 雙總體Z檢驗的公式
3.T檢驗
T檢驗是應用範圍較廣的一種檢驗,它通常用於小樣本(n<30),總體為正態分布,總體方差未知的情況。
(1)單總體小樣本的T檢驗。
檢驗統計量公式為:
(2)雙總體獨立小樣本的T檢驗。
獨立樣本檢驗的統計量公式為:
當n1=n2時,公式變為:
說明:雙總體獨立小樣本的T檢驗,要求進行方差齊性檢驗。(詳見F檢驗)
(3)相關樣本的T檢驗。
相關樣本是指兩個樣本的數據之間存在一一對應的關係。相關樣本的判斷可以從兩個角度確定:
①如果兩個樣本的數據來自同一組被測對象,這兩個樣本為相關樣本;
②如果兩個樣本的數據來自兩組彼此配對的被測對象,這兩個樣本也稱為相關樣本。
表11-9 相關樣本T檢驗的公式
(三)F檢驗
F檢驗是基於F分布進行的統計檢驗,可用來進行方差齊性檢驗(即方差差異是否顯著的檢驗)和方差分析(本書略,具體內容可參考相關教育統計教材)。
前面在雙總體獨立小樣本的T檢驗部分,其公式的適用條件之一是:總體方差未知,但差異不顯著。F檢驗可用來進行方差齊性的檢驗。
F檢驗公式:
S2大、S2小分別代表兩樣本的方差
df1=df分子-1=n分子-1,df2=df分母-1=n分母-1
查F值表[7](P=0.05或0.01)的臨界值F0.05和F0.01,若F<F0.05(或F0.01),則P>0.05(或0.01),兩樣本方差差異不顯著;反之,則差異顯著。
(四)X2檢驗(計數數據差異的顯著行研究)
1.X2檢驗的意義
教育科學研究中,我們會收集到連續性數據,同時也有非連續性的計數數據。前面介紹了主要用於連續性數據顯著性差異檢驗的Z檢驗、T檢驗和F檢驗,現在來介紹主要用於對計數資料進行的兩組或兩組以上數據差異的X2檢驗。
2.X2檢驗的常用範圍
(1)正態性檢驗。
正態性檢驗主要看實得次數是否為正態分布。例如,假設教師的身體健康水平是呈正態分布的,某幼兒園42名幼兒教師體檢後的健康狀況分別是良好15人,一般16人,較差11人。可用X2檢驗該分布是否符合正態分布。
(2)獨立性檢驗。
獨立性檢驗用於檢驗兩個或兩個以上的多項分類的變量之間是否有關聯,主要用於對雙項表中的數據進行檢驗。如檢驗父母教養態度與幼兒人際交往能力(高、中、低)這兩個變量之間是否為獨立或某種相互影響的關係。
(3)適合性檢驗。
適合性檢驗用於檢驗實際觀測到的次數分布是否與有關理論分布有差異。這一檢驗主要是對單項表中的數據進行檢驗。例如:假設幼兒喜歡紅、黃、藍、綠的人數無顯著差異。經實際測定,最喜歡紅、黃、藍、綠的幼兒分別為20人、15人、18人和21人。X2檢驗就可用來對該人次分布與期望次數(平均次數)之間的差異進行顯著性檢驗。
3.X2檢驗的基本公式
其中,f0為實得次數,fe為理論次數或期望次數,n表示計數所得的次數,P表示某種屬性出現的概率,X2的df=r-1,r 表示原始數據的組數。
由於統計分析要處理的數據量往往很大,許多統計方法,尤其是現代發展的統計方法又常常十分複雜。可以說,自產生統計學以來,計算方法問題就一直困擾著人們。隨著計算機技術的飛速發展,人們開發出各種統計軟體,極大地提高了我們的數據處理和分析能力。對一名教育研究者來說,要求每個人都熟悉統計方法的「內情」(如相關公式的推導過程)是不現實的,也是沒有必要的。關鍵是要懂得各種統計方法的作用、適用條件、結果的解釋,會上機操作,從而不至於誤用,尤其是不要從一堆無序的數據中得出一些低價值甚至誤導研究的信息。今天在教育研究中可供使用的軟體很多,例如Excel、SPSS等都可以用於進行統計分析。