flex-height
text-black

什麼是機器學習?

機器學習是通過演算法使電腦系統能夠從數據中自主發現規律、持續優化決策,並實現精準預測的智能化過程。

default

{}

default

{}

primary

default

{}

secondary

一、機器學習詳細定義

機器學習(Machine Learning, ML)是人工智慧(AI)的一個分支,讓機器通過分析數據和經驗,自動學習規律並做出預測或決策,而不是按照明確的程式碼運行作業。其核心思想是利用演算法從數據中提取模式,並不斷優化模型以提升效能。機器學習應用程式會隨著使用不斷改善,存取的資料越多、準確度越高。

三、機器學習與深度學習一樣嗎? 機器學習與人工智慧一樣嗎? 他們三者有什麽樣的關系?

機器學習是 AI 更廣泛領域的一部份,係指一種廣義概念,意即電腦執行通常需要人類智慧才能完成的工作。這些工作包括推理、理解語言、辨識圖像和解決問題。

機器學習著重於該願景的一個重要部份:可讓系統自動從資料學習。

簡單理解的方式如下:

AI 可包含規則導向的系統,遵循人類設計的邏輯模式。相較之下,機器學習可自行探索模式。機器學習演算法會利用大量資料來偵測關係、進行預測,並根據經驗調整其行為,而非仰賴預先程式設計的規則。

在許多情況下,人工智慧和機器學習之間的的界線相當模糊。語音辨識、電腦視覺和自然語言處理(NLP)都使用機器學習作為更廣泛 AI 應用的核心技術。這兩個領域相互強化,AI 提供總體架構,機器學習則提供從經驗中學習的實用工具。

這樣的區分對於採用 AI 技術的組織而言至關重要。當公司將 AI 整合至企業流程時,機器學習通常可帶來可衡量的結果,無論是預測客戶流失、優化庫存或自動化品質檢查。

機器學習如何支援生成式 AI 和代理式 AI(agentic AI)

人工智慧是所有機器學習子集的起源。它的首個子集是機器學習,機器學習下轄的子集為深度學習,而深度學習再下層的子集為神經網路。

人工智慧:簡單來說就是讓機器擁有人類的智慧

機器學習:從大量資料中學習,以達到擁有智慧的目的

深度學習:從機器學習中延伸出的一種規則方法,然後模範人類大腦進一步的去分析資料

神經網路:神經網路是深度學習的基礎架構,深度學習是神經網路在深度和復雜度上的一種擴展‌。

什麼是深度學習?

這種機器學習之所以稱為「深度」,是因為包含許多層神經網路,以及大量複雜且離散的數據。為了實現深度學習,系統會與多層神經網路互動,萃取出更高層次的結果。例如,當深度學習系統處理自然影像並尋找黑心金光菊(Gloriosa daisies)時,第一層會先辨識植物,隨著神經網路層層分析,系統會辨識出花朵,然後是菊科植物,最後便是黑心金光菊。深度學習應用的範例包括語音辨識、影像分類和藥學分析。

什麼是神經網路?

人工神經網路(ANN)是根據生物大腦神經元建立的模型,人工神經元稱為節點,於多層中叢集且平行運作。人工神經元收到數值訊號會進行處理,並傳訊號要求另一個神經元進行連接。如同人類的大腦,神經強化可以改善模式辨識、專業知識與整體學習能力。

機器學習以及深度學習與神經網路,都屬於AI的衍生領域。AI 會分析資料以制定決策和預測。機器學習演算法讓 AI 不僅能處理資料,還能在不藉助額外程式設計的情況下,使用資料進行學習並更精準。

五、機器學習有哪些類型

機器學習涵蓋許多概念,有助於說明演算法如何從資料中學習。最重要的有兩個概念是神經網路和深度學習。

什麼是監督式學習?

監督式學習是四個機器學習模式的第一種。監督式學習演算法會以範例訓練機器,學習模式包含「輸入」和「輸出」資料配對,其中輸出會標示期望值。假如目標是希望機器能辨識雛菊和三色堇的差異,一組二元的輸入資料組會包括一個雛菊影像和一個三色堇影像,這個特定組的期望結果是找出雛菊,因此雛菊會預先標識為正確的結果。

透過演算法,系統會逐步彙整所有訓練資料,並開始決定相對相似度、差異和其他邏輯點,直到能自行預測「雛菊或三色堇」問題的答案,這就如同給孩子一組有參考答案的問題,然後要求他們作答並解釋自己的邏輯。監督式學習模式應用於我們每天互動的許多應用程式,例如產品和 Waze 等交通分析應用程式的推薦引擎,用以預測不同時段的最快路線。

什麼是非監督式學習?

非督導式學習是四個機器學習模式中的第二種。在非督導式學習模式中沒有參考答案,機器會研究輸入的資料,多數是未標記與非結構化的資料,並開始使用所有相關且可存取的資料來識別模式和關聯性。各方面來說,非監督式學習是在模仿人類如何觀察世界。我們運用直覺和經驗將事情分類,而隨著經歷更多體驗和範例,分類和識別的能力會越來越精確;對於機器而言,「經驗」則是輸入和可用的資料量。非監督式學習的常見應用包括臉部辨識、基因序列分析、市場研究和網路安全性。

什麼是半監督式學習?

半監督學習是四個機器學習模式的第三種。在理想情況下,所有資料都會在輸入系統前結構化並標記,但這顯然不太實際,因此當處理大量原始、非結構化的資料時,半監督式學習就成為可行的解決方案。這類模式會輸入少量標籤資料以強化未標籤資料集。基本上,標示的資料可讓系統開始運作,並大幅提升學習速度和準確性。半監督式學習演算法會指示機器分析已標記的資料,找出可套用至未標記資料的相對屬性。

麻省理工學院出版社研究論文的深入研究顯示,此模式具有一定的風險,系統會學習並複製標示資料中的瑕疵,而最善於使用半監督式學習的公司會確保建立最佳實務協定。半監督式學習應用於語音與語言分析、蛋白質分類等複雜醫學研究,以及高階詐欺偵測。

什麼是強化式學習?

強化式學習是第四種機器學習模式。在監督式學習中,機器會獲得參考答案,並透過找出所有正確結果之間的關聯性來學習;強化式學習模式不包含參考答案,而是輸入一系列允許的動作、規則和潛在結束狀態。當演算法的期望目標屬於固定或二元結果時,機器便可依範例學習。但是在期望結果不確定的情況下,系統必須透過經驗和獎勵來學習,在強化學習模式中,「獎勵」是數字,並設計為演算法應收集的目標。

從各方面而言,這種模式很類似於教導某人如何下棋,雖然您無法演示所有可能的棋步,但可以解釋規則,並透過練習培養技能。獎勵方式不單只是比賽獲勝,還有取得對手的棋子。強化式學習的應用包括:線上廣告買家的自動價格招標、電腦遊戲開發,以及高風險股票市場的交易。

六、企業級機器學習的實際案例

機器學習演算法可辨識模式和關聯性,因此擅長分析自己的投資報酬率。對於投資機器學習技術的公司,這項功能可讓您幾乎立即評估營運影響。以下是企業機器學習應用領域不斷成長的一個小型範例。

1、醫療健康領域

AI輔助診斷:AI系統能夠快速分析醫學影像(如X光、CT、MRI),幫助醫生更快、更準確地診斷疾病。

例如:谷歌DeepMind開發的AI系統在眼部疾病診斷中達到了94%的準確率,與頂級眼科醫生相當。根據《自然》雜誌的研究,AI在乳腺癌篩查中的準確率比放射科醫生高出5.7%(美國)和1.2%(英國)。

2、金融行業

詐欺檢測:通過分析交易模式和使用者行為,AI能夠實時識別異常交易,降低詐欺風險。

例如:Visa的AI系統每年幫助銀行和商家減少約250億美元的詐欺損失。根據Gartner的報告,使用機器學習的詐欺檢測系統可以將詐欺識別率提高30%-40%。

3、零售與電商

個性化推薦:通過分析使用者行為和購買歷史,AI能夠為使用者提供更符合需求的商品推薦,提升使用者體驗和銷售額。

例如:亞馬遜的推薦系統為其貢獻了約35%的銷售收入。根據Statista的數據,使用個性化推薦的電商平臺平均轉換率提高了10%-30%。

4、交通與物流

自動駕駛:自動駕駛技術通過減少人為錯誤,提高交通安全性和效率。

例如:Waymo的自動駕駛車隊在2023年累計行駛超過3000萬英裏,事故率遠低於人類駕駛。根據麥肯錫的研究,自動駕駛技術可以將交通事故減少90%,每年全球可挽救約120萬人的生命。

5. 製造業

預防性維護:通過分析設備運行數據,AI能夠提前預測故障,優化維護計劃,降低停機時間和維護成本。

例如:通用電氣(GE)通過AI預測設備故障,將維護成本降低了20%-30%。根據德勤的報告,使用預測性維護的工廠能夠將設備停機時間減少

6、農業

精準農業:AI通過分析土壤、氣候和作物數據,幫助農民優化種植策略,提高產量和資源利用效率。

例如:John Deere的智能農業系統通過無人機和傳感器優化作物管理,使小麥產量提高了10%-15%。根據聯合國糧農組織(FAO)的數據,精準農業技術可以將水資源利用率提高20%-40%。

ERP 和流程自動化:ERP 資料庫涵蓋廣泛且分散,其中包括銷售績效統計、消費者評價、市場趨勢報表以及供應鏈管理記錄。機器學習演算法可用來尋找這類資料的模式與關連性,透過這些洞察即時掌握各項業務領域,包括優化網路中物聯網(IoT)裝置的工作流程,或將重複或繁瑣工作自動化的最佳方式。

七、機器學習的挑戰

深度學習是機器學習的專業分支,使用多層的神經網路,因此稱之為「深度」。這些深度網路可處理大量資料、發掘細微關聯,並自動識別與工作最相關的特徵。

深度學習推動當今許多最受關注的 AI 應用,包括語音助手、圖像標記、語言翻譯和自動駕駛車。在企業情境中,它可協助組織分析文件、偵測詐欺並即時解譯複雜的感測器資料。

雖然功能強大,但深度學習也需要大量的運算資源和完善的資料準備。這就是為什麼許多公司結合傳統機器學習的方法與深度學習以在準確性、效率和可擴展性之間取得平衡。

機器學習的運作方式

機器學習透過結構化流程運作,將原始資料轉換為實用的預測或動作。雖然細節會根據演算法而有所不同,但多數機器學習系統遵循相似步驟順序。

資料收集和準備

每個機器學習專案皆從資料開始,這通常是大量資料。資料的品質會直接影響模型的效能,因此團隊會花費大量精力收集、清理並組織資料。資料準備可能涉及移除重複項目、處理遺漏值、標準化格式,或為監督式學習工作標記範例。

在企業環境中,資料通常來自多個來源:感測器、交易、客戶互動或企業系統。整合這些來源會產生更豐富的資料集,更能代表實際狀況。

訓練演算法和模型

資料就緒後,演算法會透過稱為訓練的流程中學習。訓練期間,系統會分析資料、測試不同關係並調整內部參數(通常數百萬個)以最小化錯誤。此反覆流程會持續進行,直到模型在測試資料上的表現足夠準確為止。

不同的演算法會有不同的學習方式:

訓練需要運算能力,但結果是能夠對從未見過的新資料進行預測的模型。

預測和持續改善

訓練後,模型可產生預測、分類或建議。然而,流程不止於此,在實際應用中,系統的預測會受到監控,並定期新增資料以重新訓練模型。此意見回饋和改善循環可讓機器學習系統隨時間改善。

例如:

持續學習可確保機器學習模型維持準確、相關且迅速因應變化。透過這種方式,組織可更靈活運用 AI 來因應並調整,以迎接新的挑戰和商機。

機器學習的類型

雖然機器學習採用多種形式,但多數演算法分為三個主要種類:監督式、非監督式和強化式學習。每種類型皆仰賴不同類型的資料,並達成不同成果,但皆旨在讓系統從經驗中學習,並隨時間制定更完善的決策。

監督式學習

在監督式學習中,演算法會在已標記的資料集上進行訓練,此資料集包含輸入和正確輸出。系統會透過將預測與已知答案進行比較來學習如何將輸入對應至輸出,並持續調整直到其準確性改善為止。

監督式學習是目前商業領域中最常見的機器學習形式,可用於歷史資料能清楚提供正確範例的工作,例如預測客戶流失、偵測詐騙交易或分類圖像。

例如,金融機構可能會使用標記為「詐騙」或「合法」的數千筆標記交易來訓練模型。演算法會研究每筆交易的特性,例如金額、地點、時間、裝置類型,並學習識別與詐欺相關的模式。經過訓練後,便可即時標記可疑交易,協助防止損失,減少人工審核。

監督式學習方法包括線性迴歸、邏輯迴歸、支援向量機、決策樹狀結構和深層神經網路。各方法採用稍微不同的數學方法,但原則仍然相同:從範例學習以預測未來的結果。

非監督式學習

非監督式學習處理未標記的資料,意即不包含預先定義答案的資料集。在此,演算法必須完全自行尋找模式、分組或隱藏的結構。

當組織擁有大量原始資料,但對其內部關係的理解有限時,此方法相當實用。例如,零售商可能會使用非監督式學習來根據採購行為區隔客戶,並揭示出對各促銷或產品推薦回應不同的群體。

常見的非監督式學習技術包括分群和降維。

在分群中,K-means 及階層式分群等演算法會自動將共用相似特性的資料點分組,協助揭示自然區隔,例如行為相似的客戶群體。

降維方法(例如主成分分析(PCA)),在保留最重要的資訊的同時,透過減少變數數目來簡化複雜的資料集。這有助於輕鬆視覺化大型高維度的資料,並加速模型訓練,而不會大幅降低準確性。

強化式學習

強化式學習(RL)的靈感來自行為心理學。強化式學習 Agent 不需從標記的範例中學習,而是透過與其環境互動,並以獎勵或懲罰的形式接收意見回饋來學習。目標是識別哪些動作能在長期中帶來最大的累積獎勵。

這種方法適用於最佳決策取決於一連串動作,而不是單一預測的情境。在機器人、遊戲和自動化系統中帶來突破,這些領域的決策必須根據新資訊動態調整。

例如,在物流環境中,強化式學習模型可能會學習如何優化運送路線。每個決策(例如在選擇某一條道路,而非另一條道路)會根據交貨時間和燃料效率獲得意見回饋。經過許多迭代,模型會學習出哪種策略會產生最佳的整體成果。

強化式學習結合探索(嘗試新動作)與利用(使用已學習的知識)。這種平衡可讓系統透過經驗持續改善、根據結果調整策略,而非仰賴明確指示。

這三大類(監督式、非監督式、強化式學習)構成機器學習實務的基礎。

機器學習的範例和應用

機器學習已深度融入日常生活和企業營運中。應用的範圍從個人便利工具到可大規模分析複雜資料的關鍵任務企業系統。

日常範例

在消費者領域中,機器學習經常在幕後默默運作,推動著人們每天使用的技術。

在每種情境下,機器學習都會透過將行為資料轉換為可據以行動的洞察來實現個人化,讓日常互動更快速、更準確且更直覺。

企業和商業應用案例

在商業中,機器學習的規模和影響更大。公司使用機器學習來提升效率、降低風險並發掘新商機。

常見的企業應用包括:

若要了解組織如何大規模運用這些技術,請探索各行各業的一系列企業機器學習應用,包括製造和財務、零售和醫療保健等。

企業中的機器學習不是為了取代人員,而是要強化其專業知識。透過自動化重複工作並發掘洞察,機器學習可讓員工專注於推動創新與成長的高價值決策。

機器學習的重要性:效益和挑戰

機器學習之所以重要,是因為能改變企業學習、調整和競爭的方式。其提供工具,將資料轉化為知識,再將知識轉化為行動,這在日益以資料為導向的世界中是一項不可或缺的能力。

機器學習的效益

  1. 自動化和效率:機器學習會自動化過去需要人類判斷的複雜決策流程,提升速度並降低成本。
  2. 個人化:即時量身打造體驗,因應個別使用者和客戶。
  3. 預測性洞察:透過識別歷史資料中的模式,機器學習可協助以更高的準確性預測未來結果。
  4. 持續改善:模型會從新資料學習,確保隨時間改善效能,而非停滯不前。
  5. 創新:機器學習實現全新的產品和服務,從即時語言翻譯到預測性維護和自動駕駛車輛。

這些優勢讓 ML 成為各產業數位轉型方案的核心。有效運用機器學習的企業,能在決策、客戶體驗和營運靈活度方面上取得競爭優勢。

挑戰與考量

儘管前景光明,機器學習也帶來挑戰。

解決這些挑戰需要明確的治理架構、持續監控和負責任 AI 實務。因此,必須專注於負責任設計和生產,協助確保 AI 和機器學習系統透明化、值得信任並與人類價值保持一致。

機器學習的重要性不僅在於能自動化工作,更在於如何強化人類的能力。透過運用資料導向的洞察來強化決策制定,機器學習可讓人員和企業更快創新、更聰明地營運,並自信地迎接未來。

了解更多

深入了解我們的 AI 企業資源,或註冊我們聚焦於 Business AI 的電子報

常見問題

簡單來說,什麼是機器學習?
機器學習是一種人工智慧(AI),可讓電腦從資料中學習並透過經驗自動改善。簡單來說,意即系統可找到模式並制定決策,而不是按照明確的程式碼運行作業。
機器學習的類型為何?

機器學習的三個主要類型如下:

  1. 監督式學習:使用標記資料訓練模型來進行預測。
  2. 非監督式學習:可探索未標記資料中的模式。
  3. 強化式學習:透過試錯進行學習,並由獎勵與懲罰來引導。

每種類型有不同的用途(預測、探索或決策制定),並共同支援現今的許多 AI 系統。

機器學習是否需要大量程式編碼?
機器學習涉及程式設計,但現代工具和平台使其更容易存取。開發人員通常使用 Python、R、或 Java 等語言,並搭配專門的程式庫,例如TensorFlow、PyTorch 和 Scikit-learn。然而,許多企業解決方案現在將 ML 內嵌到應用程式中,讓使用者不需撰寫程式碼,直接受益於機器學習洞察。
機器學習的主要目標為何?
機器學習的目標是讓系統不需明確程式設計,即可從資料中學習並改善其效能。透過分析大型資料集,機器學習模型可識別趨勢、進行預測,並在客戶互動到產業自動化等領域支援更完善的決策。
機器學習與資料科學的比較,其中差別為何?
資料科學是更廣泛的領域,著重於使用統計、視覺化和分析來從資料擷取洞察。機器學習是資料科學的分支,強調從資料自動學習以進行預測或決策的演算法。實際上,資料科學通常使用機器學習來建立模型,而機器學習則依賴資料科學技術進行資料準備和評估。
機器學習與統計的比較,其中關聯為何?
統計和機器學習皆著重於分析資料,但其目標有所不同。統計旨在解釋變數之間的關係,並從樣本中推論。機器學習則著重於做出準確的預測,而通常不需要人類可理解的解說。現代機器學習通常結合統計的嚴謹性和預測能力,以達成最佳結果。
分配

讓 AI 為貴公司效力

閱讀《AI 建置之旅》:將 AI 目標轉化為行動和投資報酬率的指南。

取得指南