第20講 理解AI
2024-09-26 12:10:14
作者: 日本顧彼思商學院
因AI成為當今主流的智能學習工具,所以要對以往的方法進行改善。同時,通過對數據的活用,可以獲得以前無法得到的答案。而且,這條道路今後很可能會有更長遠的發展。那麼,智能學習具體是怎樣的一種方法呢?
在講智能學習之前,首先說明一下以前是怎樣對計算機發出指令的。在考慮對計算機發出指令時,有3個必要因素:輸入(input),程序算法,輸出(output)。
其中最重要的就是程序算法。充分考慮這個程序(程序算法),是對計算機發出指令的基礎。由人去努力思考程序算法,就是一直以來使用的方法。
而另一方面,智能學習的話,作為基礎的程序(程序算法)不是由人來擬定,而是由計算機通過學習後自己去擬定的。可以大致理解為,計算機根據大量的輸入數據和與之對應的輸出數據,計算出輸入和輸出之間的相關性。
這樣一來,人應該做的事,就不是思考程序算法,而是準備大量的輸入數據和輸出數據了。在這個過程中,計算機會根據數據來找出輸入和輸出之間的關聯性,也就是可以發現程序算法。
我們用事例來進行補充說明。
例如,假設現在要擬定一個程序算法,輸入是照片,輸出是表情認知,即識別照片裡的臉是在生氣、是在笑還是哭。
在這種情況下,如果使用以前的方法,就要對頭像照片的要素進行分解,指定哪個部位應該怎樣觀察,在怎樣的條件下判斷為「在生氣」,在怎樣的條件下判斷為「在笑」,這些都是由人來思考並擬定程序算法。
相對地,如果採用機器學習的方法,最初的一步是準備輸入和輸出的數據。要準備多張頭像照片作為輸入數據,並且判斷照片裡面的表情是「在生氣」,還是「在笑」,或是「在哭」,作為輸出的數據來使用。
也就是說,把表情作為標籤和照片對應,並且,把大量頭像照片和對應的照片都錄入計算機。最後,計算機就會參考大量的數據,思考可以識別表情的程序算法。
在機器學習的過程中,可以通過以下步驟來讓計算機思考程序算法。
1. 決定什麼作為輸出
2. 決定什麼作為輸入
3. 準備多個輸出和輸入的組合
1. 決定什麼作為輸出
剛才的例子是以臉部表情作為輸出,下面我們以銷售額為輸出來講解。因為銷售額作為目標非常明確,而且從量化的角度來說,可以用金額來表示,是非常清晰易懂的輸出。
另外,如果以「學習」為例的話,情況會怎樣?以學會了或者沒學會作為輸出,雖然可以作為方向,但是很難找到清晰的判斷標準。
以往我們會以測試的分數作為是否學會的結果指標,但測試的意義不外乎是對記憶的確認,要充分考慮好定義以及具體要如何量化。
如上所述,在實際業務中,確定以什麼作為輸出是最重要的工作。
需要充分考慮「這個輸出是要獲得什麼」「這個輸出可以用什麼來計量」,還要考慮「怎樣可以量化」。
2. 決定什麼作為輸入
決定輸出的內容以後,需要儘可能找出可能對這個輸出內容產生影響的輸入內容。數據越多,程序算法的精度越高。而且,對大量的數據進行處理是計算機擅長的事。因此,要有意識地找出儘可能多的可能對輸出產生影響的內容。
另外,和輸出一致,輸入在最後也要進行量化。大家在羅列輸入內容時,同時要有意識地思考如何能夠進行量化。
3. 準備多個輸出和輸入的組合
輸出和輸入確定以後,最後一步就是準備多個這種數據的組合,把這些數據錄入計算機。
現在需要的是,輸入和輸出的大量數據。如果輸入的數據和輸出的數據都已經齊全了,就沒問題;另外,如果在某些地方已經存在這些信息,只要收集過來即可。
另一方面,如果需要重新收集數據,以後是否能夠固定地獲取數據也要一併考慮。
練習題
你在人才培養公司工作,主要負責邀請社會人士來聽本公司的講座。上司交代你,希望能夠使用AI進行判斷,向有意願聽講座的人員推薦合適的講座。你的手上有過往的實際數據,知道什麼講座比較受哪一類人群歡迎。
你考慮製作AI程序,以什麼講座受歡迎(推薦什麼比較合適)作為輸出,那麼什麼內容可以作為輸入呢?請思考幾個可能與推薦講座有關係的因素。
解答
與所屬企業有關的信息可能有行業、職位、部門、企業規模,與聽講座的人有關的信息可能有年齡層、性別等。
例如,如果收集到了以下關於輸入和輸出的數據,就要以輸入數據和輸出數據組合的形式來錄入計算機。
這樣的話,把行業、職位、部門、企業規模、講座購買者的年齡作為輸入數據錄入後,計算機就會根據對過往實際數據進行學習的結果,作為輸出,推薦哪些講座科目比較合適。
STEP UP!
從學習的意義來說,實際上不止於此。計算機推薦的科目,在推薦之後,最終是否真的銷售出去了;或者說,購買者是否選擇了別的科目,這些結果可以作為數據進行積累。這樣,講座課程是如何銷售出去的,相關數據就能進一步累積起來。
通過這樣去做,累積起來的數據就能用於下一次學習,形成良性循環。
因此,哪怕最初的數據非常粗略,重要的是嘗試邁出第一步。雖然數據量較少,結果輸出的數據精確度也不高,但是一旦開始嘗試了,數據就會進一步積累,產生更高的價值,形成良性循環。所以,大家要重視速度,儘快著手去做。
過往是由人來思考程序算法。只要準備數據,計算機就能推導出程序算法,這是以前從未有過的方法。
而且,這是一個信息量越大,精確度越高的劃時代的方法。今後,是否能夠充分運用這種方法,就決定了能取得怎樣截然不同的結果。
大家要切實理解機器學習是怎樣的一種方法,以及輸出、輸入的數據化的關鍵作用。
小結
√ 機器學習是由計算機來擬定程序算法,是從前沒有過的方法
√ 程序算法是基於大量的輸入及輸出數據,由計算機所擬定
√ 人的職責是,準備輸出和輸入的定義以及數據
√ 輸出的定義和量化的方法最為重要
√ 積存的數據會產生更高的價值,所以邁出第一步非常重要