跳至內容
機器學習識別汽車

什麼是機器學習?

機器學習與 AI 的關係?

機器學習以及深度學習與神經網路的元件,都屬於 AI 的衍生領域。AI 會分析資料以制定決策和預測。機器學習演算法讓 AI 不僅能處理資料,還能在不藉助額外程式設計的情況下,使用資料進行學習並更精準。人工智慧是所有機器學習子集的起源。它的首個子集是機器學習,機器學習下轄的子集為深度學習,而深度學習再下層的子集為神經網路。

AI 與機器學習的關係圖表

AI 與機器學習的比較圖

什麼是神經網路?

 

人工神經網路(ANN)是根據生物大腦神經元建立的模型,人工神經元稱為節點,於多層中叢集且平行運作。人工神經元收到數值訊號會進行處理,並傳訊號要求另一個神經元進行連接。如同人類的大腦,神經強化可以改善模式辨識、專業知識與整體學習能力。

 

什麼是深度學習?

 

這種機器學習之所以稱為「深度」,是因為包含許多層神經網路,以及大量複雜且分散的數據。為了實現深度學習,系統會與多層神經網路互動,萃取出更高層次的結果。例如,當深度學習系統處理自然影像並尋找黑心金光菊(Gloriosa daisies)時,第一層會先辨識植物,隨著神經網路層層分析,系統會辨識出花朵,然後是菊科植物,最後便是黑心金光菊。深度學習應用的範例包括語音辨識、影像分類和藥學分析。

機器學習如何運作?

機器學習包含不同類型的學習模式,並使用各種演算技術,根據資料的性質和期望結果,可以採用監督式、非監督式、半監督式或強化式共四種學習模式。在各個模式中可以套用一或多種演算法技術,取決於使用的資料集和預期結果。機器學習演算法主要用於分類事物、辨識模式、預測結果,並做出周全的判斷。分析複雜且難以預測的資料時,您可以選擇使用一種演算法,或是組合多種演算法以達到最佳的準確性。 

機器學習的運作流程

機器學習的運作圖表

什麼是監督式學習?

 

監督式學習是四個機器學習模式的第一種。監督式學習演算法會以範例訓練機器,學習模式包含「輸入」和「輸出」資料配對,其中輸出會標示期望值。假如目標是希望機器能辨識雛菊和三色堇的差異,一組二元的輸入資料組會包括一個雛菊影像和一個三色堇影像,這個特定組的期望結果是找出雛菊,因此雛菊會預先標識為正確的結果。

 

透過演算法,系統會逐步彙整所有訓練資料,並開始決定相對相似度、差異和其他邏輯點,直到能自行預測「雛菊或三色堇」問題的答案,這就如同給孩子一組有參考答案的問題,然後要求他們作答並解釋自己的邏輯。監督式學習模式應用於我們每天互動的許多應用程式,例如產品和 Waze 等交通分析應用程式的推薦引擎,用以預測不同時段的最快路線。

 

什麼是非監督式學習?

 

非督導式學習是四個機器學習模式中的第二種。在非督導式學習模式中沒有參考答案,機器會研究輸入的資料,多數是未標記與非結構化的資料,並開始使用所有相關且可存取的資料來識別模式和關聯性。各方面來說,非監督式學習是在模仿人類如何觀察世界。我們運用直覺和經驗將事情分類,而隨著經歷更多體驗,分類和識別的能力會越來越精確;對於機器而言,「經驗」則是輸入和可用的資料量。非監督式學習的常見應用包括臉部辨識、基因序列分析、市場研究和網路安全性。

 

什麼是半監督式學習?

 

半監督學習是四個機器學習模式的第三種。在理想情況下,所有資料都會在輸入系統前結構化並標記,但這顯然不太實際,因此當處理大量原始、非結構化的資料時,半監督式學習就成為可行的解決方案。這類模式會輸入少量標籤資料以強化未標籤資料集。基本上,標示的資料可讓系統開始運作,並大幅提升學習速度和準確性。半監督式學習演算法會指示機器分析已標記的資料,找出可套用至未標記資料的相對屬性。

 

麻省理工學院出版社研究論文的深入研究顯示,此模式具有一定的風險,系統會學習並複製標示資料中的瑕疵,而最善於使用半監督式學習的公司會確保建立最佳實務協定。半監督式學習應用於語音與語言分析、蛋白質分類等複雜醫學研究,以及高階詐欺偵測。

 

什麼是強化式學習?

 

強化式學習是第四種機器學習模式。在監督式學習中,機器會獲得參考答案,並透過找出所有正確結果之間的關聯性來學習;強化式學習模式不包含參考答案,而是輸入一系列允許的動作、規則和潛在結束狀態。當演算法的期望目標屬於固定或二元結果時,機器便可依範例學習。但是在期望結果不確定的情況下,系統必須透過經驗和獎勵來學習,在強化學習模式中,「獎勵」是數字,並設計為演算法應收集的目標。

 

從各方面而言,這種模式很類似於教導某人如何下棋,雖然您無法窮盡所有可能的棋步,但可以解釋規則,並透過練習培養技能。獎勵方式不單只是比賽獲勝,還有取得對手的棋子。強化式學習的應用包括:線上廣告買家的自動價格招標、電腦遊戲開發,以及高風險股票市場的交易。

企業級機器學習的實際案例

機器學習演算法可辨識模式和關聯性,因此擅長分析自己的投資報酬率。對於投資機器學習技術的公司,這項功能可讓您幾乎立即評估營運影響。以下是企業機器學習應用領域不斷成長的一個小型範例。

創新體驗,始於今日

瞭解 SAP 如何實際運用 AI 和機器學習。

  • 推薦引擎:從 2009 年到 2017 年,美國家庭訂閱影片串流服務的數字增加了 450%。富比士雜誌一篇 2020 年的文章表示,影片串流的使用率大幅飆升 70%。雖然推薦引擎應用於眾多零售和購物平台,但絕對會在串流影音­服務大放異彩。
  • 動態行銷:若要透過銷售漏斗找出並利用潛在商機,則必須盡可能收集和分析客戶資料。從聊天記錄到影像上傳,現代消費者會產生大量不同類型和非結構化的資料,機器學習應用程式可幫助行銷人員理解這些資料,藉此提供個人化的行銷內容,並即時與客戶和潛在客戶互動。
  • ERP 和流程自動化:ERP 資料庫涵蓋廣泛且分散的資料集,其中包括銷售績效統計、消費者評價、市場趨勢報表以及供應鏈管理記錄。機器學習演算法可用來尋找這類資料的模式與關連性,透過這些洞察即時掌握各項業務領域,包括優化網路中物聯網(IoT)裝置的工作流程,或將重複或繁瑣工作自動化的最佳方式。
  • 預測性維護:現代供應鏈和智慧工廠逐漸採用 IoT 裝置和機器,以及涵蓋所有貨車與營運的雲端連線能力。分散的資料和效率不彰會導致龐大的成本和營運中斷,而手動收集維護和修復資料時,幾乎無法預測潛在問題,但您可以讓流程自動預測並避免問題發生。IoT 閘道感測器甚至可配備在幾十年前的舊類比機器上,提升企業整體的資訊可見度與效率。

機器學習的挑戰

哈佛大學資料科學家 Tyler Vigan 在著作《虛假關連(Spurious Correlations)》中指出:「並非所有的關聯都代表因果關係。」為了說明這一點,他提供了一個圖表,其中顯示緬因州的婚禮支出與離婚率之間有著強烈相關性。當然,這個圖表是想表示調侃,真正的問題在於,機器學習不善於應對人為及演算性的偏見和錯誤,而由於這個系統善於學習和調適,因此錯誤與虛假的關聯性容易迅速在神經網路中傳播並導致偏差。

 

另一個挑戰來自機器學習模型,演算法及其輸出相當複雜,人類無法解釋或理解,這就是所謂的「黑盒子」模型,當公司發現自己無法判斷演算法得出特定結論或決定的方式和原因時,便會造成風險。

 

幸運的是,隨著資料集和機器學習演算法的複雜性不斷提升,可用於管理風險的工具和資源也隨之增加。業界領先的各家公司正透過建立強大且持續更新的 AI 管理指導原則和最佳實務協定,致力消除錯誤與偏見。

發揮機器學習的最大效益

遵循市場先行者的足跡,從這五堂課中汲取經驗。

機器學習的常見問題

機器學習是 AI 的子集,因此必須有 AI 才能存在。AI 會運用並處理資料進行決策和預測,可說是電腦系統的大腦,也是機器所展現的「智慧」。AI 內的機器學習演算法以及其他 AI 支援的應用程式,讓系統不僅能處理該資料,還能執行任務、預測、學習並更加智慧,而且無須進行任何額外的程式設計。AI 將能運用智慧與資料,執行目標明確的任務。

可以,但是應該將其作為一項企業層級的任務,而不僅僅是 IT 升級。在數位轉型專案中取得理想成效的公司,需要持續不懈地評估現有資源和技能,並確保在開始之前已建立正確的基礎系統。

資料科學屬於機器學習的子集,著重於統計和演算法,運用迴歸和分類技術解讀並傳達結果。機器學習著重於程式設計、自動化、規模化,以及整合與倉儲結果。

機器學習會尋找模式和關聯性,從中學習並隨時間逐步優化。資料解析是機器學習的資訊來源,這項技術可自行運用複雜的演算法,協助提供組織良好的資料集,交由機器學習應用程式使用。

與人工神經網路相連的神經稱為節點,這些節點會在網路層中連接和叢集,當收到數值訊號時,便會向其他平行運作的相關神經元發出訊號。深度學習使用神經網路,而「深度」是指使用非常大量的資料,並同時與多層神經網路互動。

機器學習是多種學習模式、技術和科技的結合,其中可能包括統計數據,用於運用資料進行預測並建立分析模型。

SAP Insights 電子報

立即訂閱

訂閱我們的電子報以掌握關鍵洞察資訊。

深入閱讀

返回頂部