第20講 從已經發生的事情開始判斷
2024-09-26 12:12:20
作者: 日本顧彼思商學院
一方面,進行調查,根據得知的結果進行進一步的調查,這樣的思路很重要。另一方面,並不是所有的調查都能全部實施。在已知信息的範圍內推測發生了什麼情況,然後接著進行下一步分析,這種基本預測法目前比較流行。基本預測法是怎樣的思維方式呢?
現在要招募臨時的學生兼職者,有較多應聘者,最終有幾名職員來進行面試。每個職員負責面試3人,人員隨機分配。你拿到3人的簡歷,偶然取出來的簡歷是一位女性的。我們試想一下,你負責面試的3人全是女性的概率有多少?前提是應聘者中的男女人數相同。
本書首發𝙗𝙖𝙣𝙭𝙞𝙖𝙗𝙖.𝙘𝙤𝙢,提供給你無錯章節,無亂序章節的閱讀體驗
我們羅列出所有可能的情況。為了方便說明,3人分別稱為A、B、C。以下是所有的情況。
你取出來的簡歷碰巧是女性的,所以從上述的表格中選擇女性的話,有以下12種可能性。(為了便於說明,添加編號)
最後,我們從推測取出來的簡歷是哪一份簡歷開始梳理。
如果取出來的簡歷屬於女性1至女性3,那麼就是情況2、情況3、情況4,這3種情況都是只有1名女性;如果取出來的簡歷屬於女性4、女性5,就是情況5;如果取出來的簡歷屬於女性6、女性7,就是情況6;如果取出來的簡歷屬於女性8、女性9,就是情況7,這些情況都是有2名女性;如果取出來的簡歷屬於女性10至女性12,就是情況8,這種情況有3名女性。
偶然選取的簡歷屬於女性,說明簡歷有可能是屬於女性1至女性12之一,共12種可能。那份簡歷如果是從3名都是女性的狀態中選取出來的,就是情況8,共有3種可能。因此,概率就是3÷12=0.25。
關鍵點1. 把所有可能發生的情況列舉出來
關鍵點2. 將情況分類並記錄頻率
關鍵點3. 對照確認想調查的情況是否符合條件
1. 把所有可能發生的情況列舉出來
首先,把有可能發生的情況全部列舉出來。
如果只考慮本次例子的最終狀態,那麼將男性與女性的人數分別表示出來的話(男性的人數、女性的人數),有(3名、0名)、(2名、1名)、(1名、2名)、(0名、3名)4種模式。而從上表知道,
3名都是男性的情況,有1種可能
2名是男性的情況,有3種可能
1名是男性的情況,有3種可能
0名是男性的情況,有1種可能
概率並不相同。
可以想像一下,類似於一個硬幣投3次都是正面朝上的概率,跟硬幣投3次有2次正面朝上的概率相比,後者的概率是前者的3倍,這樣比較容易理解。要記住,需要把所有的情況都仔細羅列出來。
2. 將情況分類並記錄頻率
把所有的情況都羅列出來之後,數一數本次發生的情況可能會發生的頻率。要認真確認,防止遺漏。
3. 對照確認想調查的情況是否符合條件
最後,計算出想調查的情況發生的概率。在本次的例子中,偶然取出的一份簡歷屬於女性,我們要計算的是3份簡歷都屬於女性的概率,所以想調查的情況是,取出3份女性的簡歷,總共有12份,那麼3÷12=0.25。
同理計算其他的情況。3份簡歷中只有1名女性的情況也是有3種可能,所以概率是3÷12=0.25;3份簡歷中有2名女性的情況有6種可能,所以概率是6÷12=0.5。
練習題
在與上述背景相同的前提下,一個職員要負責4人的面試,當偶然取出的簡歷屬於1名女性時,請思考一下,你負責的應聘者中,有2名男性、2名女性的概率是多少。
解答
與剛才一樣,為了便於說明,我們把4名應聘者稱為A、B、C、D,有可能發生的情況是以下16種。
抽到女性簡歷的可能性有32種。(為了方便說明,編上編號)
我們想調查的情況是,4份簡歷中有2名男性、2名女性的情況。表中的情況6至情況11符合條件。
在這個範圍內抽取出的簡歷是女性有12種可能,即女性5至女性16之一。因此,4份簡歷包含2名男性、2名女性的概率是12÷32=0.375。
STEP UP!
在每個職員負責4人面試的前提下,偶然取出的簡歷是女性,4份簡歷包含2名男性、2名女性的概率剛才已經進行了計算。那麼我們也算出其他情況的概率,計算的結果如下。
男性4名、女性0名的概率 0
男性3名、女性1名的概率 4÷32=0.125
男性2名、女性2名的概率 12÷32=0.375
男性1名、女性3名的概率 12÷32=0.375
男性0名、女性4名的概率 4÷32=0.125
這次碰巧抽取出女性的簡歷,所以以此為前提進行了概率的計算,而本身男性與女性的人數構成是怎樣的概率呢?以下是計算的結果。
男性4名、女性0名的概率 1÷16=0.0625
男性3名、女性1名的概率 4÷16=0.25
男性2名、女性2名的概率 6÷16=0.375
男性1名、女性3名的概率 4÷16=0.25
男性0名、女性4名的概率 1÷16=0.0625
如果把原本的狀態作為事前概率,把中途追加了信息、根據信息計算出來的概率作為事後概率的話,可以總結如下。
我們從左邊開始解讀。如果沒有任何信息,男性、女性的構成比例等於事前概率。在增加了「包含1名女性」的信息後,男性、女性的構成比例就相當於事後概率。也就是說,在增加了信息後,概率會發生變化。另外,信息增加以後,從不確定的狀態變化為增加了一個確鑿的信息,所以精確度會提升。這種思路稱為「基本預測法」。
這種思路還可以適用於以下的情境。請稍作思考。
假設有同樣用黑布做成的不透明袋子共100個,其中有20個裡面有金幣。我們如果有一台裝置可以在不打開袋子的情況下辨別是否有金幣在內,且這個裝置的實力情況如下:
·在有金幣的時候,能正確辨別的概率為90%
·在沒有金幣的時候,能正確辨別的概率為95%
現在,從100袋中取出1袋,讓這個裝置辨別有沒有金幣在內,裝置判斷袋子內有金幣。那麼,這個袋子裡真的有金幣的概率是多少呢?
為了便于思考,我們假設100袋都讓這個裝置進行辨別。
首先,關於有金幣的20袋,裝置能準確辨別的概率是90%,也就是說裝置將會判斷出20×90%=18袋。
另一方面,有10%的概率會判斷錯誤,即有2袋雖然是有金幣的,但卻會被判斷為沒有金幣。
接著,關於沒有金幣的80袋,同樣讓裝置去辨別的話,裝置能準確判斷的概率是95%,也就是說會判斷80×95%=76袋是沒有金幣的。另一方面,因為錯誤率是5%,所以有4袋雖然是沒有金幣的,但卻會被判斷為有金幣。
把整體情況進行整理後,如下表所示。
因此,這個裝置判斷有金幣的次數是18+4=22次。在這裡面,真正有金幣的是18次,所以其概率是18÷22≈0.82。
本來在100袋裡面,只有20袋裝有金幣,所以如果只是隨便猜的話,猜中的概率是20%,而通過利用這個裝置,猜中的概率可以提升到約82%。
我們在以上的部分說明了能夠辨別袋子內是否有金幣的裝置,而這個裝置也可以換成以下的內容來想像。
·根據圖像數據辨別有沒有生病的AI
·根據照片辨別問題位置的AI
·根據文字信息讀取內容的AI
·預測明日天氣的AI
我們不一定要依靠AI,其實在我們身邊有許多方法,雖然準確率不是100%,但也可以以一定的精確度得出結論。在考慮應該如何解釋AI判定的結果時,可以運用這些方法。
假設一個概率,根據所得的信息,再對假設的概率進行進一步修正,在無法預測下一步的情況下,這種方法被認為比較有效。如上文提到的,可以在解釋AI算出的結果的時候使用這種方法,而且本來AI中應用的機器學習等技術背後也蘊藏著這種思路,大家有興趣的話可以深入學習研究。
小結
√ 有一種方法是先算出事前概率,然後根據獲得的信息更新概率
√ 羅列出所有可能的情況
√ 確認其中符合條件的情況
√ 根據所有情況的數量和符合條件的信息計算概率
√ 這是AI背後蘊藏的思路,是當今重要的方法,請大家掌握好