מהי למידת מכונה?

למידת מכונה היא תת קבוצה של בינה מלאכותית (AI) שבה מחשבים לומדים מנתונים ומשתפרים עם ניסיון מבלי להיות מתוכנתים במפורש.

הגדרת למידת מכונה בפירוט

למידת מכונה היא תת קבוצה של בינה מלאכותית (AI). היא מתמקדת בהוראת מחשבים ללמוד מנתונים ולהשתפר עם הניסיון – במקום להיות מתוכנתים במפורש לעשות זאת. בלמידת מכונה, אלגוריתמים עוברים הכשרה למציאת תבניות וקורלציות בסטים גדולים של נתונים ולקבל את ההחלטות והתחזיות הטובות ביותר בהתבסס על ניתוח זה. יישומי למידת מכונה משתפרים עם השימוש והופכים למדויקים יותר ככל שיש להם גישה ליותר נתונים.

 

יישומים של למידת מכונה כולם סביבנו –בבתינו, עגלות הקניות שלנו, מדיה הבידור שלנו והבריאות שלנו.

כיצד קשורה למידת מכונה ל-AI?

למידת מכונה – ומרכיביה בלמידה עמוקה וברשתות עצביות – כולם מתאימים כתתי קבוצות קונצנטריות של בינה מלאכותית. AI מעבדת נתונים כדי לקבל החלטות וחיזויים. אלגוריתמים של למידת מכונה מאפשרים ל-AI לא רק לעבד את הנתונים, אלא להשתמש בהם כדי ללמוד ולקבל חכם יותר, מבלי להזדקק לתכנות נוסף. בינה מלאכותית היא ההורה של כל תתי הסטים של למידת המכונה שמתחתיה. בתוך סט המשנה הראשון היא למידת מכונה; בתוך זאת למידה עמוקה, ואז רשתות עצביות בתוך זה.

מהי רשת עצבית?

 

רשת עצבית מלאכותית (ANN) מעוצבת על ידי הנוירונים במוח ביולוגי. נוירונים מלאכותיים נקראים צמתים והם מקובצים יחד בשכבות מרובות, הפועלים במקביל. כאשר נוירון מלאכותי מקבל אות מספרי, הוא מעבד אותו ומסמן את הנוירונים האחרים המחוברים אליו. כמו במוח אנושי, חיזוק עצבי מביא לשיפור בזיהוי תבניות, מומחיות ולמידה כוללת.

 

מהי למידה עמוקה?

 

סוג זה של למידת מכונה נקרא "עמוק" משום שהוא כולל שכבות רבות של הרשת העצבית ונפחים מסיביים של נתונים מורכבים ושונים. כדי להשיג למידה מעמיקה, המערכת מעורבת במספר שכבות ברשת, ומבצעת שליפה של פלטים ברמה גבוהה יותר. למשל, מערכת למידה עמוקה שהיא עיבוד תמונות טבע וחיפוש אחר דאיזי גלוריוזה – בשכבה הראשונה – מזהה צמח. בזמן שהוא עובר דרך שכבות העצבים, אז הוא יזהה פרח, אחר כך דייזי, ולבסוף דאיזי גלוריאוזה. דוגמאות ליישומי למידה עמוקה כוללות זיהוי דיבור, סיווג תמונה וניתוח תרופות.

כיצד עובדת למידת מכונה?

למידת מכונה מורכבת מסוגים שונים של מודלים של למידת מכונה, תוך שימוש בטכניקות אלגוריתמים שונות. בהתאם לאופי הנתונים והתוצאה הרצויה, ניתן להשתמש באחד מתוך ארבעה מודלים של למידה: מפוקח, לא מפוקח, מפוקח למחצה או חיזוק. בתוך כל אחד מהמודלים הללו, ניתן ליישם טכניקה אלגוריתמית אחת או יותר - יחסית לסטים של הנתונים שנמצאים בשימוש והתוצאות המיועדות. אלגוריתמים של למידת מכונה נועדו באופן בסיסי לסווג דברים, למצוא דפוסים, לחזות תוצאות ולקבל החלטות מושכלות. ניתן להשתמש באלגוריתמים אחד בכל פעם או לשלב אותם כדי להשיג את הדיוק הטוב ביותר האפשרי כאשר מעורבים נתונים מורכבים ובלתי צפויים יותר.

כיצד עובד תהליך למידת המכונה

מהי למידה מפוקחת?

 

למידה מפוקחת היא הראשונה מבין ארבעה מודלים של למידת מכונה. באלגוריתמים של למידה מפוקחת, המכונה נלמדת על ידי דוגמה. מודלי למידה מפוקחים כוללים צמדי נתונים "קלט" ו"פלט", שבהם הפלט מסומן בערך הרצוי. לדוגמה, בוא נאמר שהמטרה היא למכונה לספר את ההבדל בין דאיסיות לפאנסיות. זוג נתוני קלט בינארי אחד כולל גם תמונה של דייזי וגם תמונה של פנזי. התוצאה הרצויה עבור זוג מסוים זה היא לבחור את הדאיזי, ולכן היא תזוהה מראש כתוצאה הנכונה.

 

באמצעות אלגוריתם, המערכת מרכיבה את כל נתוני האימון האלה לאורך זמן ומתחילה לקבוע קווי דמיון קוריחים, הבדלים ונקודות לוגיקה אחרות – עד שהיא יכולה לחזות את התשובות לשאלות דאיזי-או-פנסי כולן בעצמה. זה המקביל לתת לילד סט של בעיות עם מפתח תשובה, ואז לבקש מהם להראות את עבודתם ולהסביר את ההיגיון שלהם. מודלים מפוקחים של למידה משמשים ברבות מהיישומים שאיתם אנו מקיימים אינטראקציה בכל יום, כגון מנועי המלצה למוצרים ואפליקציות ניתוח תנועה כמו Waze, אשר מנבאים את המסלול המהיר ביותר בזמנים שונים של יום.

 

מהי למידה לא מפוקחת?

 

למידה לא מפוקחת היא השנייה מבין ארבעת המודלים של למידת מכונה. במודלים של למידה ללא פיקוח, אין מפתח תשובה. המכונה חוקרת את נתוני הקלט – הרבה מהם לא מתויגים ולא מובנים – ומתחילה לזהות דפוסים וקורלציות, תוך שימוש בכל הנתונים הרלוונטיים והנגישים. במובנים רבים, למידה לא מפוקחת מעוצבת באופן שבו בני אדם צופים בעולם. אנחנו משתמשים באינטואיציה ובניסיון כדי לקבץ דברים ביחד. ככל שאנו חווים יותר ויותר דוגמאות של משהו, היכולת שלנו לקטלג ולזהות אותו הופכת למדויקת יותר ויותר. עבור מכונות, "ניסיון" מוגדר לפי כמות הנתונים שהם קלט והופכים לזמינים. דוגמאות נפוצות של יישומי למידה לא מפוקחים כוללות זיהוי פנים, ניתוח רצף גנים, מחקר שוק ואבטחת סייבר.

 

מהי למידה מפוקחת למחצה?

 

למידה מפוקחת למחצה היא השלישית מתוך ארבעה מודלים של למידת מכונה. בעולם מושלם, כל הנתונים יהיו מובנים ומתויגים לפני שהם נקלטים לתוך מערכת. אבל מכיוון שזה כמובן לא בר ביצוע, למידה מפוקחת למחצה הופכת לפתרון בר ביצוע כאשר יש כמות עצומה של נתונים גולמיים ולא מובנים. מודל זה מורכב מהזנת כמויות קטנות של נתונים מתויגים כדי להגדיל סטים של נתונים ללא תוויות. באופן חיוני, הנתונים המתויגים פועלים כדי לתת התחלה רצה למערכת ויכולים לשפר במידה ניכרת את מהירות ודיוק הלמידה. אלגוריתם של למידה מפוקחת למחצה מנחה את המכונה לנתח את הנתונים המסומנים עבור תכונות תואמות שניתן להחיל על הנתונים ללא התווית.

 

כפי שנחקר לעומק במאמר מחקר זה של MIT Press, ישנם, עם זאת, סיכונים הקשורים למודל זה, בהם פגמים בנתונים המסומנים נלמדים ומשוכפלים על ידי המערכת. חברות שמשתמשות בהצלחה רבה ביותר בלמידה מפוקחת למחצה מבטיחות שפרוטוקולים של שיטות עבודה מומלצות קיימים. למידה מפוקחת למחצה משמשת בניתוח דיבור ולשוני, מחקר רפואי מורכב כמו קטגוריזציה של חלבונים ואיתור הונאות ברמה גבוהה.

 

מה זה לימוד חיזוקים?

 

למידת חיזוק היא מודל למידת המכונה הרביעי. בלמידה מפוקחת, המכונה מקבלת את מפתח התשובה ולומדת על ידי מציאת קורלציות בין כל התוצאות הנכונות. מודל לימוד החיזוק אינו כולל מפתח תשובה אלא מקלט מערך של פעולות מותרות, כללים ומצבי סיום פוטנציאליים. כאשר המטרה הרצויה של האלגוריתם היא קבועה או בינארית, מכונות יכולות ללמוד על ידי דוגמה. אבל במקרים שבהם התוצאה הרצויה ניתנת לשינוי, על המערכת ללמוד על ידי ניסיון ותגמול. במודלים של לימוד חיזוקים, ה"תגמול" הוא מספרי ומתכנת לתוך האלגוריתם כמשהו שהמערכת מבקשת לאסוף.

 

במובנים רבים, המודל הזה אנלוגי להוראת מישהו כיצד לשחק שחמט. ודאי, יהיה בלתי אפשרי לנסות להראות להם כל מהלך פוטנציאלי. במקום זאת, אתה מסביר את הכללים והם בונים את המיומנות שלהם באמצעות תרגול. פרסים באים בצורה של לא רק ניצחון במשחק, אלא גם רכישת פיסות היריב. יישומי למידה של תגבור כוללים הגשת הצעות מחיר אוטומטיות לקניינים של פרסום מקוון, פיתוח משחקי מחשב וסחר בשוק המניות של חברת High Stakes.

למידת מכונה ארגונית בפעולה

אלגוריתמים של למידת מכונה מזהים תבניות וקורלציות, מה שאומר שהם טובים מאוד בניתוח תשואה להשקעה של עצמם. עבור חברות המשקיעות בטכנולוגיות למידת מכונה, תכונה זו מאפשרת הערכה כמעט מיידית של ההשפעה התפעולית. להלן רק מדגם קטן של חלק מהתחומים הצומחים ביישומי למידת מכונה ארגונית.

  • מנועי המלצה: בין 2009 ל-2017 עלה מספר משקי הבית בארה"ב המנויים לשירותי הזרמת וידאו ב-450%. וכתבה ב-2020 במגזין פורבס מדווחת על זינוק נוסף בנתוני שימוש בהזרמת וידאו של עד 70%. למנועי המלצה יש אפליקציות בפלטפורמות רבות של קמעונאות וקניות, אבל הן בהחלט מגיעות לעצמן באמצעות סטרימינג של מוזיקה ווידאו.

  • שיווק דינמי: יצירת פריטי Lead והפעלתם דרך משפך המכירות דורשת יכולת לאסוף ולנתח כמה שיותר נתוני לקוחות. צרכנים מודרניים מייצרים כמות עצומה של נתונים מגוונים ולא מובנים – החל מתעתיקי צ'אט ועד להעלאות תמונה. השימוש ביישומי למידת מכונה עוזר למשווקים להבין נתונים אלה – ולהשתמש בהם כדי לספק תוכן שיווקי מותאם אישית ומעורבות בזמן אמת עם לקוחות ולידים.

  • ERP ואוטומציית תהליך: בסיסי נתונים של ERP מכילים סטים רחבים ושונים של נתונים, שעשויים לכלול סטטיסטיקה של ביצועי מכירות, סקירות צרכנים, דוחות מגמת שוק ורשומות ניהול שרשרת אספקה. ניתן להשתמש באלגוריתמים של למידת מכונה כדי למצוא קורלציות ודפוסים בנתונים כאלה. לאחר מכן ניתן להשתמש בתובנות אלה כדי ליידע למעשה כל תחום בעסק, כולל מיטוב תהליכי העבודה של התקני 'אינטרנט של דברים' (IoT) בתוך הרשת או הדרכים הטובות ביותר לאוטומציה של משימות שחוזרות על עצמן או נוטות לשגיאות.

  • תחזוקה תחזיתית: שרשראות אספקה מודרניות ומפעלים חכמים עושים יותר ויותר שימוש במכשירי IoT ובמכונות, כמו גם בקישוריות בענן בכל הציים והתפעול שלהם. פירוקים וחוסר יעילות עלולים להביא לעלויות ושיבושים עצומים. כאשר נתוני אחזקה ותיקון נאספים ידנית, כמעט בלתי אפשרי לחזות בעיות פוטנציאליות - אפשר לבד להפוך תהליכים לאוטומטיים כדי לחזות אותם ולמנוע אותם. ניתן להתאים חיישני שער של IoT למכונות אנלוגיות ישנות, המספקות נראות ויעילות בכל העסק.

אתגרים של למידת מכונה

בספרו "מתאמים מזוויעים", מדען נתונים והרווארד, טיילר ויגאן, מציין ש"לא כל הקורלציות הן אינדיקציה לקשר סיבתי בסיסי". כדי להמחיש זאת, הוא כולל תרשים המציג מתאם חזק לכאורה בין צריכת המרגרינה לבין שיעור הגירושים במדינת מיין. כמובן שתרשים זה נועד להקנות נקודה הומוריסטית. עם זאת, עם הערה רצינית יותר, יישומי למידת מכונה פגיעים גם להטיה אנושית וגם לשגיאה באלגוריתם. ובשל נטייתם ללמוד ולהתאקלם, טעויות וקורלציות ספוגות יכולות להתפשט במהירות ולזהם תוצאות ברשת העצבים.

 

אתגר נוסף מגיע ממודלים של למידת מכונה, בהם האלגוריתם והפלט שלו מורכבים כל כך עד שלא ניתן להסביר אותם או להבין אותם בני אדם. זה נקרא מודל "קופסה שחורה" והוא מציב חברות בסיכון כאשר הן מוצאות את עצמן לא מסוגלות לקבוע כיצד ומדוע אלגוריתם הגיע למסקנה או החלטה מסוימת.

 

למרבה המזל, ככל שמורכבות סטים של נתונים ואלגוריתמים של למידת מכונה גדלה, כך גם הכלים והמשאבים הזמינים לניהול סיכונים. החברות הטובות ביותר פועלות לביטול הטעויות וההטיה על ידי הקמת קווים מנחים חזקים ומעודכנים של ממשל בינה מלאכותית ופרוטוקולים של שיטות עבודה מומלצות.

שאלות נפוצות בנושא למידת מכונה

למידת מכונה היא תת קבוצה של בינה מלאכותית ולא יכולה להתקיים בלעדיה. בינה מלאכותית משתמשת ומעבדת נתונים כדי לקבל החלטות ותחזיות – זהו המוח של מערכת מבוססת מחשב והוא ה"אינטליגנציה" המוצגת על ידי מכונות. אלגוריתמים של למידת מכונה בתוך ה-AI, כמו גם יישומים אחרים המופעלים על ידי AI, מאפשרים למערכת לא רק לעבד את הנתונים, אלא להשתמש בהם כדי לבצע משימות, לבצע תחזיות, ללמוד ולקבל מידע חכם יותר, מבלי להזדקק לתכנות נוסף. הם נותנים ל-AI משהו מוכוון מטרה לעשות עם כל האינטליגנציה והנתונים האלה.

כן, אבל צריך לפנות לזה כמאמץ כלל עסקי, לא רק שדרוג IT. החברות שיש להן את התוצאות הטובות ביותר עם פרויקטים של טרנספורמציה דיגיטלית מבצעות הערכה לא מחמיאה של ערכות המשאבים והמיומנויות הקיימות שלהן ומבטיחות שיש להן את מערכות היסוד המתאימות לפני תחילת העבודה.

יחסית ללמידת מכונה, מדע הנתונים הוא תת קבוצה; הוא מתמקד בסטטיסטיקה ובאלגוריתמים, משתמש בטכניקות רגרסיה וסיווג, ומפרש ומעביר תוצאות. למידת מכונה מתמקדת בתכנות, אוטומציה, דירוג ושילוב תוצאות ואחסון.

למידת מכונה מתבוננת בדפוסים ובקורלציות; היא לומדת מהם ומייעלת את עצמה כפי שהיא הולכת. כריית נתונים משמשת כמקור מידע עבור למידת מכונה. טכניקות כריית נתונים משתמשות באלגוריתמים מורכבים עצמן ויכולות לסייע לספק סטים של נתונים מאורגנים טוב יותר לשימוש ביישום למידת המכונה.

הנוירונים המחוברים בעלי רשת עצבית מלאכותית נקראים צמתים, אשר מחוברים ומקובצים בשכבות. כאשר צומת מקבל אות מספרי, אז הוא מסמן נוירונים רלוונטיים אחרים, הפועלים במקביל. למידה עמוקה עושה שימוש ברשת העצבית והיא "עמוקה" משום שהיא משתמשת בנפחים גדולים מאוד של נתונים ועוסקת במספר רב של שכבות ברשת העצבית בו זמנית.

למידת מכונה היא האמלגם של מספר מודלים של למידה, טכניקות וטכנולוגיות, שעשויים לכלול סטטיסטיקה. הסטטיסטיקה עצמה מתמקדת בשימוש בנתונים כדי לבצע תחזיות וליצור מודלים לניתוח.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel