首頁> 其他類型> 學前教育研究方法> 二、數據資料的分析——描述統計

二、數據資料的分析——描述統計

2024-08-14 20:41:00 作者: 王彩鳳 莊建東

  對已獲得的數據進行整理、概括,顯現其分布特徵的統計方法,稱為描述統計。其目的在於將大量零散的、雜亂無序的數據資料進行整理、歸納、簡化、概括,使事物的全貌及其分布特徵清晰、明確地顯現出來。描述統計數據常用的特徵量有:集中量、差異量和相關量。平均值、標準差、相關係數分別是最常用的集中量、差異量和相關量。

  (一)數據集中趨勢的描述

  集中量是反映一組數據集中趨勢的量,反映頻數分布中大量數據向某一點集中的趨勢。描述這種集中趨勢的量數主要有算術平均數、加權平均數、中位數、眾數等。

  1.算術平均數

  算術平均數常用來估計、比較研究對象總體水平。例如,要想比較兩組幼兒的身高,不能將其身高一一列出來進行比較,這種個別的比較是看不出什麼結果的。如果將兩組的平均數加以比較,就會既簡潔又明了地得出結果。

  

  必須注意的是,當數據較多,可靠性要求較高的時候,可用平均數說明問題。如果數據較少,或者其中含有極端數值,用平均數作代表值就未必合適。

  2.中位數和眾數

  (1)中位數。又稱中數,指按大小順序排列的一組數據中居於中央位置的數,用Md 表示。若數據的個數是奇數,就以位於中央的數據作為中位數;如數據的個數是偶數,則以最中間的兩個數據的平均數作為中位數。

  例2:2,5,7,9,10,11,12的中位數Md =9

  中位數對位於兩端的數據不像平均數那麼敏感,它還適用於當分布的兩端有未知數據,數據個數已知的情況,但中位數的可靠性程度不如平均數。

  (2)眾數。眾數即一組數據中出現次數最多的數值。

  例3:25,37,21,37,45,50,37,25這一組數據中,眾數為37。

  眾數的計算比較簡單,但眾數不穩定,代表性不好,教育統計中一般不採用眾數來反映數據的集中趨勢。只有當數據分布中出現極端數據時,才用眾數作為集中量的粗略估計。

  (二)數據離散程度的描述

  要全面地描述數據的分布情況,僅僅用集中量說明分布的集中趨勢是不夠的,還必須指明各個數據之間的差異程度(即離散程度)有多大,因為數據之間的差異程度是次數分布的另一個重要特徵。

  例4:甲、乙兩組幼兒教師教育理論的測驗分數分別為:

  甲組:82,85,79,79,83,82,84;乙組:90,92,80,75,76,74,87。

  兩組分數的平均數均為82,但離散程度卻不同。甲組比較集中、整齊,即變異較小;乙組比較分散、參差不齊,即變異較大。可見在描述一組數據分布特徵時,僅僅用集中量是不夠的,還必須用該組的差異量加以輔助說明。應用最廣的差異量是標準差S(δ)。其計算公式如下:

  S甲<S乙,說明甲組測驗分數變異程度小,即數據比較集中。

  標準分數又稱Z分數,是原始分數與平均數之差除以標準差所得的數值,可表示一個數據在團體中所處的位置,所以也叫相對位置量數。其計算公式為:

  Z分數若為正值,表示相對應的原始分大於平均數,Z分數若為負值,表示相對應原始分小於平均數。

  由於Z分數有正負,使用不便,因此,也可以採用T分數。

  T分數50以上越高越優;50以下越低越差。

  標準分數在教育科研中的應用,比較多地用在成績評定和錄取新生工作上。

  (三)數據關係的推斷

  在學前教育實踐中,常常需要研究變量與變量之間的關係,如幼兒的家庭環境與同伴交往能力之間的關係;某一試題的得分與試卷總分之間的關係;家長的文化水平與兒童智力水平的關係等,都要用相關量來描述。

  相關是指兩列變量之間的相互關係。一般有三種性質的相關:一是正相關,即兩列變量的變化方向一致,當一種變量變動時,另一種變量也發生或大或小的同方向變動,如兒童身高和體重的關係,一般來說,兒童身高越高,體重越重。二是負相關,即兩列變量的變化方向相反,當一種變量變動時另一種變量發生或大或小的反方向變動,如堅持鍛鍊身體的時間長短與身體患病率的關係,堅持鍛鍊身體的時間越長,身體的患病率就越小。三是零相關,即兩列變量的變化方向無一定規律,如人的外貌與智力發展水平是毫無關係的零相關。用來描述兩個變量相互之間變化方向及密切程度的數字特徵量稱為相關係數,一般用r表示。其取值範圍在-1.00到+1.00之間。正負號表示相關的方向,正號表示正相關,負號表示負相關,其絕對值大小表示相關的程度。當r=0時為零相關,表示兩個變量的變化互不相關。r的絕對值接近1,r為高相關;r的絕對值接近0,為低相關;介於其中的為中等相關。

  計算相關係數時,要求兩列變量必須成對。相關係數的計算有許多公式,不同的情況要使用不同的公式(可參見王孝玲著《教育統計學》第十一章),這裡所介紹的是積差相關(也稱為皮爾遜相關),用於計算兩組連續性數據的相關程度。基本公式為:

  相關係數在教育和心理的科學研究中應用較多,如對考題或測驗量表進行質量分析,就要用相關的方法來檢驗其信度、效度等。需要注意的是,相關係數只能描述兩個變量之間的變化方向及密切程度,並不能揭示兩者之間的內在本質聯繫。


關閉