第三節 數據資料的整理與分析
2024-08-14 20:40:58
作者: 王彩鳳 莊建東
一、數據資料的整理
數據資料是指在學前教育科學研究的過程中,通過各種研究方法收集到的一些用數量形式表現的有關教育現象或事實的資料。如通過調查法收集到的某幼兒園幼兒睡眠狀況的資料,通過測驗法收集到的某區幼兒園幼兒智力發展水平的成績等數據。由於數據資料一般數量巨大且雜亂無章、質量參差不齊,因此數據資料的整理是指對收集到的原始數據進行檢查和分類,並在此基礎上用統計圖表形式表現出來,使其條理、直觀、系統的一種方法。數據資料的整理具體步驟如下。
(一)檢查資料
教育科學研究的最終目的是通過有效、真實、完整的資料得出科學準確的結論,因此數據資料整理的首要工作是進行數據資料的檢查,即對所收集到的原始數據的有效性、正確性和完整性進行必要的質量審核,以確保即將分析研究的資料是有效、真實和完整的。
所謂資料的有效性是指收集到的原始數據必須具有普遍的代表性,能有效地說明研究的目的,反映研究的需要。所謂資料的正確性是指收集到的原始數據不能出現與事實有出入的情況,即收集資料時必須做到客觀精確,不能出現因主觀影響和各種工作中的粗心或不慎引起的錯誤的數據。資料的完整性是指反映研究對象的資料在各個項目上不應有遺漏,以確保統計分析的全面性。如問卷或量表是否全部收回,實驗的數據是否全部收集等。鑑於在資料收集的過程中有可能由於疏忽或不慎將錯誤的、無代表性的數據收集進資料中,以及有可能遺失部分重要資料,所以要求研究者在進行數據資料檢查時,應及時地刪除錯誤或無關數據,並根據實際情況對缺失的數據進行補充,以保證研究收集的每一個數據的質量,進而確保整個研究的有效進行。
(二)數據分類
數據分類是指按照研究對象的本質特徵,根據分析研究的目的、任務,以及統計分析時所用統計方法的可能性,將所獲得的數據進行分組歸類。它是對數據進行歸納、整理、簡化、概括的第一步,為進一步分析研究打下了基礎。分類標誌按形式可分為性質類別和數量類別。
1.性質類別
性質類別是按事物的不同性質進行分類。這種分類不表明事物之間的數量差異。如可把幼兒按性別分為男和女;按組別分為實驗組和對照組;按年齡分為4歲組和5歲組;按健康狀況分為好、中、差等。
請記住𝖇𝖆𝖓𝖝𝖎𝖆𝖇𝖆.𝖈𝖔𝖒網站,觀看最快的章節更新
2.數量類別
數量類別是按數值大小進行分類,並排成順序。在排列順序時,可以直接按數值大小進行排列,也可以用等級順序進行排列。
(1)順序排列法。順序排列法就是將各數據從大到小或從小到大進行排列。這樣就可看出最大和最小的數據是多少,各數據出現的次數和位於中間的是什麼數等。如果一組數據數目不多,可直接排序;如果數目較多,一般就要編制一個次數分布表。
(2)等級排列法。等級排列法即根據順序排列劃分等級,但與順序排列不同,它是按數值所含的意義確定。如對於考試成績或能力測驗的分數,應將數值大的排為第一等;對於體育競賽的測試時間或完成一項任務所用的時間數據,應將數值小的排為第一等。
(三)編制統計表與統計圖
通過教育調查和教育實驗獲得了大量的數據,用歸組、編表、繪圖等統計方法對之進行歸納、整理,可以直觀形象地反映其分布特徵。
1.統計表
統計表是用來表達統計指標與被說明的事物之間數量關係的表格。它具有簡明清晰,條理清楚,易於分析、比較,便於計算等優點。
(1)編制統計表的基本原則是:表的結構要簡單明了。一張表只能有一個中心,說明的問題要重點突出,一目了然;表的層次要清楚,項目、指標的排列要按照邏輯順序合理安排。
(2)統計表的結構及編制要求:統計表一般由表號、標題、標目、數據、線條、表注等幾部分組成。
①表號。表號是表的序號,一般寫在表的左上方或標題的前面,如果只有一個表可以省略。②標題。標題是表的名稱,應確切地、簡明扼要地說明表的內容,一般寫在表的上方居中位置。③標目。標目是表格中對統計數據分類的項目,一般寫在表的左側(稱為橫標目)或在表的上端(稱為縱標目)。標目要清晰、恰當。縱、橫標目的排列次序,可按時間的先後、事物的重要性、數字的大小和地理的自然分布等有規則地排列。④數據。這是用來說明標目的,可以是觀測值,也可以是計算的結果,如百分比、平均數等。表內數據必須準確、清楚,一律用阿拉伯數字,單位統一,位次對齊,精確度要一致。表內不應有空格,暫缺或未記錄可用「……」來表示,無數字用「—」表示,數字若是「0」,則應填寫「0」。如有相同的數字仍需全部寫出,不得寫「同上」字樣。⑤線條。一般統計表上下端的頂線和底線用實線繪製,左右兩邊可以不用線段封死,縱標目用細實線隔開,以便於區別;另一種統計表的格式為:縱列和橫列之間都用線段劃分,統計表的整體邊框完整,外邊框用較粗的實線。⑥表注。一般用來註明數據的來源,以便查對。可用簡短的小號字寫在表的下方。它不是表的必要組成部分。
(3)統計表的種類。統計表按主要項目的分項情況,一般可分為單項表和多項表兩種。
①單項表。僅包括一種事項的比較或僅按一種標誌分類的統計表,如表11-1所示。
表11-1 2009年我國幼兒園數量統計表[1]
②多項表。這是包括兩種及兩種以上事項的比較或按兩種以上標誌進行分類的統計表,如表11-2所示。
表11-2 2006—2009年湖南省幼兒園、幼兒班級及在園幼兒數量增長情況統計[2]
2.統計圖
統計圖是用來表達統計指標與被說明的事物之間數量關係的圖形。它是將統計資料利用幾何的點、線、面、體和色彩的描繪,把所研究對象的特徵、內容結構、相互關係表達得更直觀形象,使人一目了然,便於粗略地比較和分析,富於生動性、形象性。
(1)統計圖的結構及編制要求:統計圖一般是由圖號、圖題、圖目、圖形、圖例和圖注等幾部分構成。
①圖題。這是統計圖的名稱,即圖的標題。圖題文字要簡明扼要,切合圖的內容,字體在圖中應最大,一般寫在圖的正下方。圖號應寫在圖題的左邊。
②圖目。這是圖中的標目,是對圖中每一部分的說明,可以是文字或數據。圖目寫在圖的基線下面。在採用直角坐標系的統計圖中,圖目即橫軸上所指的各種單位名稱,應按自左到右,由小到大的順序排列。縱軸一般是尺度線,自下而上,從小到大,寫在縱軸上。
③圖形。這是指表示統計數字大小的線條和圖形。這是統計圖的主體部分,圖形線要準確清晰,繪圖布局結構要勻稱,一般位於圖的中央,所占面積應以圖框內面積的一半為宜。圖形線條是圖中各線條最粗的。
④圖例。這是舉例說明某部分圖形所代表的事物,一般放在圖中空白位置。
⑤圖注。凡圖形或其局部,要藉助文字加以補充說明的,均成為圖注。圖注部分的文字要少而精,字號要小,一般寫在圖題的左下方。
(2)統計圖的種類。
①條形圖,又稱直方圖。條形圖是用相同寬度的條形長短或高低來表示事物數量大小的一種圖形。它主要用於比較性質相似的間斷性資料。條形圖有單式、複式兩種,由一組數據資料繪製的圖形是單式條形圖;由兩組或兩組以上資料繪製的圖形是複式條形圖。按直條圖排列的方向不同,又可分為縱條圖和橫條圖,如圖11-1[3]、圖11-2[4]所示。
圖11-1 大、中、小班教師開啟的交往行為事件比較圖
圖11-2 某幼兒園中(一)班和中(二)班幼兒繪畫各等成績人數條形圖
條形圖的繪製要領:各個(類)直方長條的寬度要相同,單式條形圖的色調要一致;相鄰長條之間的間距要適當,根據統計項目的多少以及直方長條的寬度來衡量,一般來說,這種間距大約為直方條寬度的0.5~1倍;複式條形圖不同類型的直方條宜用不同的色調加以區別,並在圖形右上方適當位置標明圖例;要把比較的統計事項的直方條靠在一起,而橫軸上所標明的分類項目(一重分類)的直方條之間要相互間開,其間距一般取直方條寬度的1~1.5倍。
②圓形圖,又稱餅圖。圓形圖是以圓中的扇形面積來表示事物總體內部百分比構成的統計圖,同樣用於比較性質相似的間斷性資料,如圖11-3所示[5]。
圖11-3 2008年全國不同性質幼兒園所占比例圖
圓形圖的繪製要領:以適當的半徑作一圓,代表總體事物;分別以各統計事項在其總體中的比例乘以圓周角360°,求出各相應扇形的圓周角;根據各計算結果,一次用量角器把整個圓分化成若干個扇形部分,並在其中標上各自的百分比數值。
③線形圖。線形圖是以起伏的折線來表示某種事物的發展變化及演變趨勢的統計圖。適用於描述某種事物在時間序列上的變化趨勢,也適用於描述一種事物隨另一種事物發展變化的趨勢,還可適用於比較不同的人物團體在同一心理或教育現象上的變化特徵及相互聯繫,如圖11-4所示[6]。
圖11-4 2002—2009年學前教育毛入園率變化情況
線形圖的繪製要領:在平面直角坐標系中,橫軸一般代表自變量,縱軸一般代表因變量。橫軸既可作為連續變量的量尺,也可作為離散型變量的量尺,但縱軸一般均代表連續變量的量尺。根據有關具體數據,在由縱橫兩軸所決定的平面上畫記圓點,然後用稍粗一些的線段把相鄰的點依次連接。在同一個圖形中,允許畫若干條(一般不超過5條)不同的線形圖,以便比較分析。但是,要用不同形式的折線,如虛線、實線、點畫線,或不同顏色的折線等加以區分,並在圖中適當位置標明圖例。
(四)編制次數分布表與次數分布圖
1.次數分布表
次數分布是指把觀測到的全部數據按大小順序和一定的組距進行分組統計後,各組所含數據個數的分布。次數分布表是指次數分布的列表形式,是一種常用的統計表。
(1)間斷變量的次數分布表。
例如,某班35名學生,對5道選擇題做對的次數分布,可用表11-3來表示。即全錯的有1人,做對1題的有2人……
表11-3 35名學生5道選擇題做對的次數分布表
(2)連續變量的次數分布表。
例1:50名幼兒數數成績分別為:
44,45,47,40,40,42,43,36,37,37,38,39,32,32,34,35,34,28,28,29,30,30,31,31,29,24,24,25,25,26,26,26,27,27,20,21,22,23,23,23,16,17,18,19,12,14,15,8,9,10。下面我們對這些雜亂無章的數字進行分組,編成次數分布表。其編制的步驟為:
①求全距。全部數據中最大值與最小值之差稱為全距,用R表示。如例中R=47-8=39。
②決定組數和組距。將全距分成若干組時要確定組數和組距。組數即分組的個數,用K表示。分組的個數取決於樣本容量的大小。分組時一般以10~15組為宜,最多不超過20組,最少不少於10組。組距就是每一組內包含的距離,用I表示。最常用的組距為1、2、3、5、10個單位等。組距I、全距R、組數K三者之間的關係大略可以表示為I=R/K。為了計算方便,一般取I為整數。例1中確定K為10,根據公式I=R/K,可以確定I=4。
③確定組限。組限即一個組的起點值和終點值。前者稱為組下限,後者稱為組上限,上限與下限的差為組距I。本例中,把第一組確定為[44,48),第二組為[40,44),第三組為[36,40),其餘以此類推(注意:這裡採用的是左閉右開區間的書寫方式,說明各組登記數據次數時包括下限不包括上限)。
④求各組的組中值。組中值是每組上下限之和的平均值,用m表示。如第一組的組中值為(44+48)/2=46。在計算分析時,一般可以用組中值代表該組數據的平均值。
⑤統計次數。按照各組(分組區間)中數據出現的次數來統計。最好將數據先排序(從大到小),再統計每組數據的個數(即次數)並登記。
⑥給出次數分布表。為了對數據的了解更深入,通常在次數分布表中列出次數比率、次數百分比,以及累加次數、累加百分比等。
從表11-4中可得出幼兒分數的分布情況,有助於研究者對整體情況有一個大概的了解。但是,要想通過次數分布表清楚了解在每一分數線以下有多少人,還要制出累加次數分布表(略)。
表11-4 50名幼兒數數成績的簡單次數分布表
2.次數分布圖
根據次數分布表繪製的統計圖稱為次數分布圖。它一般適用於表示連續性數據,如身高、成績等的分布。常見的有直方圖、多邊圖等。
(1)直方圖。
直方圖是由同一底線上相互連接的矩形所構成。其繪製方法是:首先作一直角坐標系,以縱軸尺度表示數據的分組。矩形的寬度表示組距,矩形的高度表示各組的次數。注意:橫軸上所標出的最小值與零點的距離可以不按實際差距標出,只要適當空出一段距離即可;另矩形間的直線可以繪出也可以去掉。例1的次數直方圖如圖11-5所示。
圖11-5 50名幼兒數數成績次數直方圖
(2)多邊圖。
次數多邊圖是一種反映次數分布的線形圖。其繪製方法與次數直方圖基本相同。它是以各組的組中值為橫坐標,次數為縱坐標,在直角坐標系上分別描出對應的點,然後把每相鄰兩點用線段連接,並將兩端畫至外側一組的組中點處與基線相交,便得到一個次數多邊形,如圖11-6所示。
圖11-6 50名幼兒數數成績次數多邊圖