第11講 把握平均數
2024-09-26 12:09:27
作者: 日本顧彼思商學院
平均數能夠用一個數值來說明統計總體的特徵,是非常有力的指標。這個概念無論對誰來說都耳熟能詳,便於充分理解。然而,需要留意的是,只看數字的話,有可能導致誤解產生,存在風險。那麼,具體應該怎樣使用平均數、應該注意些什麼呢?
假如你是銷售部的一員。昨天,舉辦了一場面向新客戶的銷售研討會,參加者有10位。有一份滿分為5分的滿意度調查問卷,10位參加者的調查結果如下。
這個調查結果需要向上司報告,你會怎樣報告呢?例如,可以說3分的有3人,4分的有4人,5分的有3人,像這樣報告「每個分數有多少人」。但如果這樣報告的話,上司很難馬上得出整體印象。
在這種時候,有一種指標可以傳遞整體印象,那就是平均數。
算出10份問卷的分數總和(3+3+…+5+5=40分)。
這個總和除以總份數,可以算出平均分40÷10=4.0分。
這樣的話,結果就是「總共10份問卷,平均分是4.0分」,不需要進行個別分數的報告,用一個數字就可以表達問卷調查的結果。此外,這樣計算平均數,哪怕問卷份數增加至100份、1000份,都是有效的。
計算平均數,可能要花一些力氣,但不管是100份的結果還是1000份的結果,都能夠用一個數字來表達。平均數是可以用一個數值來表示統計總體的代表值。
1. 進行計算
2. 轉化為圖表
想要靈活運用平均數,首先要進行計算。另外,還有一點很重要,就是把數據轉化為圖表,讓整體情況可視化!建議大家養成習慣,以上兩點要配合進行。下面分別進行詳細說明。
1. 進行計算
大家看到數字時,首先請嘗試計算平均數。算出所有數據的總和,然後除以數據樣本數。計算本身只是加法和除法,是小學生都能做的簡單計算。
2. 轉化為圖表
其次,就是嘗試轉化為圖表。圖表可以幫助我們從視覺上把握整體的分布情況。
我們以剛才的問卷調查為例,進行詳細介紹。圖1是把剛才的問卷調查結果轉化為圖表的情況。
整體的分布以平均數4分為中心,3分和5分均勻地分布在兩側。以平均數4分作為代表這個樣本的值似乎沒有不妥。
接下來,我們看看圖2。圖2計算平均數的結果也是4分。然而,它的分布情況是分成3分和5分這兩大部分,並不存在4分的數據。在這種情況下,雖然平均數確實是4分,但是用4分作為代表這個樣本的值(代表值)是否合適呢?似乎有些不妥。
我們再來看看圖3。平均數同樣是4分,但分布情況是,1分的數據有2個,4分的有2個,而半數以上都是5分。雖然半數以上都是5分,但由於受到2個1分的影響,平均數只有4分。那麼用4分作為代表這個樣本的值(代表值)是否合適呢?對於這種情況,也是留有一點疑問。
如上述例子,雖然平均數同樣為4分,但有可能是圖1的分布,也有可能是圖2或圖3那樣的分布。總之,平均數只是計算出來的數值,並不是在表示數據如何分布。
正因如此,我們不僅要計算平均數,還必須轉化為圖表,把握清楚整體的分布情況。
此外,一般聽到「平均數」,人們就會認為是類似圖1的分布,也就會自然地聯想為,處於平均數的數據在整體數據中是最多的。
因此,如果數據的分布情況類似圖1,由於4分的數據在整體數據中占得最多,那麼結論為平均分是4分,就沒多大問題。
但是,如果數據的分布類似圖2或圖3,結論只說「平均分是4分」的話,就變成只看平均數了,聽者可能會自然聯想到圖1那樣的分布。
因此,如果是圖2那樣的分布情況,就要說明「平均分是4分,但分化為3分和5分兩極」;如果是圖3那樣的分布情況,就要說明「平均分是4分,但超過半數的分數是5分以上,反而受到了部分1分的影響」,不要只看平均數,通過圖表觀察整體分布情況而得知的信息,要在報告時添加上去。
練習題
銷售部有員工A至員工I,共9名成員。在某一周,他們每人的銷售額(單位:萬日元)如表2所示。你要對這個結果進行報告,所以馬上進行了計算和圖表化。
1. 進行計算
9名成員單周的銷售額平均數是(100+101+102+109+110+111+112+113+132)÷9=110萬日元
2. 轉化為圖表
把9人的銷售額數據轉化為圖表後,如圖4所示。
現在問題如下:如果要把計算出來的平均數(110萬日元)作為銷售部的成績(代表值),那麼有哪些地方必須留意呢(提示:關於員工I,應該怎樣去考量)?
解答
從圖表來看,員工I的銷售額,相比於其他8名成員似乎有著不同的傾向。因此,如果要把員工I包含在內來計算平均數的話,就需要把握清楚,員工I與其他8人相比,有沒有特殊情況。
例如,要先確認好,員工I「銷售的貨物是否與其他8人不同」「是否負責與其他8人不一樣的區域」等,有沒有出現特殊的情況。
如果要把平均數作為代表值,那麼必須確認清楚,「其中是否包含特殊的數據」。數據的圖表化,也是輔助判斷是否包含特殊數據的一種有效手段。
STEP UP!
最後,介紹一下平均數以外的代表值——中位數。
中位數是指在所有數據中,剛好排在中間位置的數據的值。
我們嘗試找出剛才的銷售部銷售額數據中的中位數。
這個例子有9名成員,所以正中位置,即第5名成員的數據的值(銷售額)就是中位數。第5名成員是員工E,員工E的銷售額是110萬日元,所以中位數是110萬日元。
下面,我們確認一下平均數和中位數有哪些不同的特徵。
請看圖5。此時員工I的銷售額是222萬日元,是一個更突出的數值。員工I的特殊性,與圖4相比更為明顯了。
我們算一算圖5的中位數和平均數。
中位數與圖4的道理相同,排在9名成員的正中央,即第5名員工E的數據。員工E的銷售額是110萬日元,所以圖5的中位數是110萬日元。另一方面,平均數是(100+101+102+109+110+111+112+113+222)÷9=120萬日元,與剛才的圖4相比,高了10萬日元。
在9個數據中,員工I與其他8人相比較為突出,這一點在圖4和圖5中是相同的。由於平均數受到員工I的值的影響,所以圖4與圖5的結果不一樣。而另一方面,圖4和圖5的中位數是相同的數值。
如上所述,中位數具有不易受特殊數據影響的特徵。當整體數據中包含了特殊數據時,或者在整體數據的分布不是左右對稱的情況下,有時活用中位數作為代表值會比較好,請大家記住這一點。
小結
√ 平均數可以用一個值代表整體,是便利的指標
√ 看到數字,就嘗試進行計算和圖表化
√ 圖表化之後,可以通過視覺把握整體數據的分布情況
√ 要確認是否包含特殊的數據
√ 中位數也是代表值的一種,且具有不易受特殊數據影響的特徵