一、資料的分組整理
2024-08-16 10:08:45
作者: 張燕 邢利婭
(一)數據檢查和分類
主要檢查數據的完整性和正確性。統計資料完整性的檢查,就是要根據調查(測查)項目檢查是否填寫齊全,避免遺漏,刪去重複。正確性就是檢查收集的資料是否真實可靠。
數據分類,也稱統計分類或統計歸組,就是把收集來的數據進行分組歸類。一般又分為品質分類和數量分類。
1.品質分類
是按事物性質劃分為不同的組別、種類。例如,以性別為標誌可分為男與女;以「理解能力」「思維的靈活性」「合作精神」為標誌,可分為好的、較好的、差的等幾種水平,每種水平可看成一類,每一類可再給以相當的數量,可以通過各類所包含的數據再進行數量化的比較和分析。
2.數量分類
即按數量的屬性分類。有順序排列法、等級排列法和次數分布法等。
(1)順序排列法:將各數據從大到小或從小到大進行排列。這樣就可看出最高分和最低分是多少、各分數出現的次數和位於中間的是什麼數等。
(2)等級排列法:即根據順序排列劃分等級,但與順序排列不同,它是按數值所含的意義確定,若是學習成績,測查某一方面能力的分數,應以數值大的排為第一等級,若是反映時間,則最小的數值排為第一等級。
(3)次數分布法:是指總體或樣本按隨機變量(數據)大小次序在頻率上的排列。也就是編制次數分布表。
(二)統計分組
表9-1是一組未經整理的數據,從表上看不出什麼規律,但通過分組整理就可了解分布大致的情況,步驟如下。
表9-1 37位學生的測量成績
1.不全距
求全距也稱求兩級差。全距以R表示,就是全部數據中的最大數減最小數。本例全距(兩級差):
R=98-57=41
2.確定組數
視數據資料的性質和數據多少而定。通常數據在100以上可分為10~20組,數據在100以下可分為5~10組。一般以10組以上、20組以下為宜,這樣可使計算方便而又不失其精確性。本例中全距為41,分為9組比較適當。
3.求組距
組距就是每一組的間距,即每組所包含的單位。組距以「i」表示。
為計算方便,以組距取5為宜。
4.確定各組上限和下限
上限就是每組的最高分,下限就是每組的最低分。根據本題分數分布情況,我們把第一組確定為56~60分,第二組定為61~65分,其餘類推。
5.求各組的組中值
組中值=(上限+下限)÷2
第一組的組中值=(56+60)÷2=58
第二組的組中值=(61+65)÷2=63
同樣,第三組為68;第四組為73,依此類推。
(三)編制次數分布表和累積次數分布表
對資料進行分組整理後,將數據按其數值大小列入各個相應的組別內,便可以呈現一個有規律的表式。這種統計表稱之為次數分布表。製作步驟如下。
1.標記各組次數
把原始分數里的每一個分數標到次數分布表中的「標號」欄,一般用「||||」或「正」字標號。例如,57和60都屬50~60這一組,就在這一組的「標號」欄中劃「‖」。這主要是為計算次數方便。
2.根據標號記次數(又稱頻數)
這樣,我們便得到了一個分組次數分布表(見表9-2)。
表9-2 次數分布表的製作
從表9-2可以看出數據分布的集中趨勢和分散的情況。但若想知道兒童測量成績在若干分數以上的人數或若干分數以下的人數及其百分比,則需要編制累積次數表,見表9-3。
表9-3 累積次數分布表的製作
根據表9-3,欲知成績在若干分數以上人數,即從由大到小的累積次數這一欄內找其對應數即可。例如,要問成績在76分以上者有多少,即從累積次數由大到小找到第五個數「26」便是,占全體人數的70%;若想知成績在76分以下的人數,即從由小到大的累積次數,由下向上找到第四組「71~75」對應數是11便是,占全體人數的30%。