מהו עיבוד שפה טבעית?
עיבוד שפה טבעית היא צורה של למידת מכונה המאפשרת לאנשים לתקשר עם בינה מלאכותית (AI) באמצעות שפה אנושית.
סקירה של עיבוד שפה טבעית
סקירה והגדרה של NLP
עיבוד שפה טבעית (NLP) הוא ענף מרתק של בינה מלאכותית שמאפשר לאנשים ולמכונות לתקשר אחד עם השני בשפה היומיומית. הדרך שבה נותנים פקודות קוליות לסירי או לקבל תרגומים על גוגל הן שתי הדוגמאות ל-NLP בפעולה, משום ששתיהן מציגות הבנת תוכנה והן תגובה לשפה האנושית.
כיצד NLP קשור ל-AI?
רוב האנשים אינם מתכנתים או משתמשי כוח תוכנה, וזו אחת הסיבות לעיבוד שפה טבעית היא כל כך שימושית. לתוכנה יכולה להיות עקומת למידה תלולה, ו-NLP מאפשרת להשתמש בתוכנה מורכבת אפילו בלי להפוך למומחית. למעשה, NLP מאפשר לך פשוט לתאר מה אתה רוצה ל-AI באותו האופן שבו אתה עשוי להסביר את זה לחבר.
המונח AI מכסה מגוון רחב של טכנולוגיות, אך ענף NLP מתמקד באתגרים של השפה האנושית. כדי להיות שימושיים באמת, פתרונות NLP צריכים לעשות יותר מאשר רק לתפוס את המילים שאתה אומר. מערכות NLP צריכות להבין את ההקשר והכוונה מאחורי המילים שלך. כדי להפוך את זה לאפשרי, מפתחי NLP משתמשים בטכנולוגיות בינה מלאכותית אחרות כמו למידת מכונה ולמידה עמוקה.
מדוע עיבוד השפה הטבעית חשוב?
עיבוד שפה טבעית מאפשר להשתמש בטכנולוגיה שעשויה להיות קשה לשימוש אחרת. הוא גם מאפשר למחשבים להבין טקסט ודיבור באופן שהם לא יכלו לפני NLP. הנה כמה מהיתרונות של NLP:
NLP עוזר לאנשים להיות יותר פרודוקטיביים
בעבודה, עיבוד שפה טבעית יכול להגביר את היעילות שלך בכך שהוא מאפשר לך להשתמש באוטומציה עבור משימות שחוזרות על עצמן או צורכות זמן. לדוגמה, מחלקת שירות לקוחות עשויה להשתמש בצ'אטבוטים המופעלים על-ידי NLP כדי לטפל בשאילתות שגרתיות של לקוחות. לחלופין, מחלקת חשבונאות עשויה להשתמש במערכות מופעלות NLP כדי למשוך מידע עיקרי מחשבוניות וקבלות ולהשתמש בו כדי לאכלס בסיס נתונים או גיליון אלקטרוני.
כהטבות נוספות, אוטומציה של הזנת נתונים ועיבוד מפחיתה את הסיכויים לשגיאה אנושית ומאיצה תהליכי עבודה. כאשר מערכת יכולה להבין היטב את השפה האנושית כדי להשתלט על משימות בסיסיות, היא מגבירה את הפרודוקטיביות בכך שהיא מאפשרת למשתמשים להתמקד במשימות בעלות ערך גבוה יותר.
NLP עוזר לשפר את חוויות הלקוח
כשאתה מנסה להגיע לעסק בטלפון אבל לא יכול לעבור עץ טלפונים מבלבל, אתה נתקל במערכת תגובה קולית אינטראקטיבית עם הכשרה גרועה. אבל צ'אטבוט NLP מאומן היטב יכול להעניק ללקוחות חוויה אינטואיטיבית יותר. אתר מסחר אלקטרוני עם מערכת מותאמת NLP, למשל, יכול לנתח באילו מוצרים לקוח דפדף באתר. על ידי הבנת העניין של המוצרים ללקוח, המערכת יכולה להציע מוצרים שסביר שהלקוח ירצה.
צ'אטבוטים המופעלים על-ידי NLP של שירות לקוחות משפרים את החוויות באמצעות מענה על שאלות או פתרון בעיות במהירות. ניתן לתכנן צ'אטבוטים אלה כך שתהיה להם היסטוריה מלאה של אינטראקציות של לקוח ולזהות בעיות שיש ללקוח בעבר.
NLP יוצר תובנות חדשות
אם אי פעם שלחת אימייל לעסק לשאול שאלה, להציע עצה או לרשום תלונה, זה יכול להיראות כאילו אף אחד אפילו לא קורא אותה. וזה אולי המקרה, כי לעסקים מעטים יש זמן לקרוא כל פיסת משוב של לקוחות שהם מקבלים. אבל ל-NLP-enabled AI יש את הזמן. הוא יכול לסחוף דרך סטים עצומים של נתונים כמו שיחות לקוחות באתרי אינטרנט. לאחר מכן הוא יכול לתת לעסקים סיכום אמין של אותם דיונים, כך שהעסק יוכל לתקן את הנושא.
כיצד פועל עיבוד שפה טבעית?
הנה איך NLP הופך שיחות אנושיות ומכונות לאפשריות. השלבים הבאים חלים על שפה בצורת טקסט. NLP לשפה מדוברת קצת שונה אבל עוקב אחר אותם עקרונות כלליים.
נשתמש במשפט לדוגמה כדי להציג כיצד התהליך עובד:
"אני אוהב להדגים איך עובד עיבוד שפה טבעית".
האלגוריתם מתחיל בעיבוד מקדים של טקסט.
עיבוד מקדים של טקסט
עיבוד מקדים של טקסט מתייחס לפישוט הטקסט שאנשים יוצרים כדי להקל על האלגוריתמים של NLP לעבד שפה אנושית.
- יצירת Tokenization
טוקניזציה היא תהליך של פירוק המילים ופיסוק במשפט לאסימונים. יצירת אסימון חשובה מכיוון שהיא יעילה יותר עבור אלגוריתמים של NLP לעיבוד אסימונים מאשר טקסט בעת ביצוע משימות כמו מפתוח וחיפוש. המשפט לדוגמה יש בו שמונה מילים: "אני אוהב להדגים איך עובד עיבוד שפה טבעית". יש לזה גם תקופה, אז מקבלים שמונה אסימונים על ידי ספירת המילים ואחד על ידי ספירת התקופה, בסך הכל תשעה אסימונים.
- Lowercasing
פעולת Lowercasing היא התהליך של המרת כל האסימונים לאסימונים באותיות קטנות כדי להפוך את סט הנתונים לפשוט יותר. במשפט לדוגמה, אחד האסימונים היה "אני". כדי למנוע עמימות ולהגביר את היעילות, הצעד הנמוך ממיר את האסימונים האלה באותיות גדולות ל-"i". החוקים להזרקה מסתבכים יותר בחלקים אחרים של התהליך.
- מסיר מילות עצירה
דרך נוספת לפשט את הטקסט לעיבוד שפה טבעית היא הסרת מילים שאין להן משמעות משמעותית, הנקראות מילות הפסקה. במשפט לדוגמה, המילים "אי" ו"איך" יועדו בדרך כלל מילות הפסקה. כאשר אלגוריתם מסיר אותם, נותרו לך שבעה אסימונים, שהם "כמו", "מפגינים", "טבעיים", "שפה", "עיבוד", "עובד" ו".".
- התייצבות ולמיטיזציה
גם עם שבעת האסימונים שנותרו יש מקום לפישוט רב יותר. שיטה אחת, בועטת, היא חיתוך מילה מטה לבסיסה או צורת השורש שלה. האסימון "מדגים" היא מילה שבונה על הגזע "דמונסטר" בדיוק כפי ש"טבעי" בונה על "נאטור", ולכן המודל מחליף את האסימונים המקוריים בגבעולים "דמונוסטר" ו"נאטור".
למילה יכולות להיות משמעויות שונות בהקשרים שונים, ולמימטיזציה הוא תהליך קביעת המשמעות הנכונה בהקשר מסוים. המשפט לדוגמה כולל "לייק", שיכול להתפרש כ"נהנה" או "דומה ל". במקרה כזה, הלמטיזציה תביא להקצאת ההקשר שבו "כמו" פירושו "ליהנות".
ייצוג טקסט
השלב הבא הוא ייצוג טקסט, אשר ממיר מילים לפורמט מספרי שמכונה יכולה לעבד. בנוסף למספרים, ניתן להמיר טקסט לווקטורים או לשיבוץ, שהם פורמטים מורכבים יותר המספקים מידע כמו הקשר.
- תיק מילים (BoW)
מחשבים נהדרים בספירה, ומדידת ה-BoW סופרת כמה פעמים מופיעה מילה במסמך. אם המילים קבוצה, משחק וציון מופיעים בתדירות גבוהה במסמך, למשל, ההקשר סביר יותר להיות ספורט. למשפט לדוגמה יש רק מופע אחד של כל מילה. ייצוג ה-BoW יראה שכל מילה מתרחשת פעם אחת בלבד:
{"i": 1, "לייק": 1, "מדגים": 1, "איך": 1, "טבעי": 1, "שפה": 1, "עיבוד": 1, "עובד": 1}
- TF-צה"ל (תדירות מסמך הופכי לתדירות תקופה)
TF-צה"ל משתמש בנוסחה המבוססת על תדירות הופעת מילה בסט נתונים כולל המורכב ממסמכים רבים כדי לקבוע את חשיבותה של מילה. ככל שמילה מופיעה לעתים קרובות יותר, כך משקל ה-TF-צה"ל שלה נמוך יותר, וככל שהיא פחות חשובה במסמך אחד. מילים כמו "ה" ו"א" מופיעות לעתים קרובות למדי, וכך הן פחות חשובות. היית מייצג את המשקולות של המשפט לדוגמה בצורה משהו כזה, ומראה שלמילים הנפוצות יש משקלים נמוכים יותר ולמילים לא שכיחות יש משקלים גבוהים יותר:
{"i": 0.1, "כמו": 0.1, "מדגים": 0.3, "איך": 0.1, "טבעי": 0.2, "שפה": 0.2, "עיבוד": 0.5, "עובד": 0.1}
ניתוח טקסט
ניתוח טקסט הוא הנקודה שבה אלגוריתם NLP שולף משמעות מטקסט. זו הדרך שבה אלגוריתם יכול להפיק תגובות מתאימות לשאילתת המשתמש.
- זיהוי ישות בעלת שם (NER)
לאחר ביצוע ניתוח כמותי מסוים, אלגוריתמים של NLP מחפשים אחר מילים שמזוהות כשמות של משהו. המילה תפוח מתייחסת לסוג של פרי, אך המילה אפל מתייחסת לחברה ספציפית, ואלגוריתם NLP זקוק לדרך של הכרה בהבדל. המשפט לדוגמה, "אני אוהב להדגים איך עובד עיבוד שפה טבעית", כולל את המילים "עיבוד שפה טבעית", שאנשים עשויים לזהות כמתן שם לטכנולוגיית בינה מלאכותית. זה מיוצג באופן הבא:
פלט NER: [("עיבוד שפה טבעית", "טכנולוגיה")]
- ניתוח סנטימנט
חלק מסטי הנתונים, כמו קטלוג של חלקי מכסחת חוק, עשויים שלא להיות בעלי נימה רגשית משמעותית. אבל סקירת קולנוע עשויה להיות בעלת נימה רגשית חזקה. אם לסט נתונים יש טון, ניתוח סנטימנט הוא השלב בעיבוד שפה טבעית הלוכד אותו. עבור המשפט לדוגמה, ניתוח הסנטימנט עשוי להיראות כך:
פלט סנטימנט: חיובי
ניתוח תחביר
לכל משפט מבנה דקדוקי. ניתוח תחביר הוא תהליך של ניתוח מבנה זה למציאת שמות עצם, פעלים, נושאים וכו'. דבר זה חשוב משום ששפות שונות משתמשות בתחביר שונה, ולכן ניתוח תחביר חיוני לתרגום מכונה. עבור המשפט לדוגמה, ניתוח תחביר עשוי ליצור תוצאה זו:
עץ תחביר: (שורש (NP (PRP I)) (VP (דמוי VBP) (S (VP (VBG מדגים) (SBAR (WHADVP (כתיבה)) (S (NP (NNP טבעי) (שפת NNP) (עיבוד NNP)) (VP (VBZ עובד)))))))))
בהתאם לאלגוריתם הספציפי, בדרך כלל יהיו שלבים נוספים. התוצאה היא שיחה שבה נראה שהמכונה מבינה את דבריך וכוונתך ומגיבה לכם בשפה טבעית.
מהן דוגמאות למשימות עיבוד בשפה טבעית?
בקרה על דרקון עם פקודות קוליות
אפילו לטכנולוגיה החזקה ביותר יש ערך מוגבל אם לא יודעים להשתמש בה. עיבוד שפה טבעית הופך את הטכנולוגיה לנגישה יותר. הוא מפחית את הצורך בידע טכני מיוחד כדי לקבל את היתרונות של תוכנה מתקדמת או חומרה. משתמשים יכולים לקיים אינטראקציה עם מערכות מותאמות NLP באמצעות שיחה טבעית במקום להסתמך על פקודות מורכבות, קידוד או בקרות פיזיות.
לדוגמה, יישום שליטה מרחוק לדפנות קטנות יכול לאפשר פשוט לומר לדרון לעשות משהו כמו הפוך באוויר, בלי צורך ללמוד את הבקרות המסובכות שתצטרך להשתמש בהן אחרת. היכולת להשתמש בפקודות קוליות פשוטות מאפשרת ליותר אנשים להשתמש בטכנולוגיה.
קבלת תובנות טובות יותר עבור ניהול מותגים
אנשים מבטאים את מחשבותיהם והעדפותיהם בכל יום, ולעסקים יש גישה לחלק גדול מהנתונים האלה. עסקים כבר משתמשים בנתונים כמו מכירות מוצרים כדי להבין היבטים מסוימים בהתנהגות הלקוח. בעזרת פתרונות עיבוד שפה טבעית, מחשבים יכולים להפוך שיחות מדיה חברתית וסקירות לקוח מקוונות גם למידע הניתן לביצוע.
התובנות של NLP הן סוג שונה של מידע מאשר כלי ניתוח מסורתיים של מכירות. נתוני מכירות בשימוש עסקי עבור תובנות תפעוליות כמו חיזוי או ניהול משאבים, אבל ניתוח מבוסס NLP יכול להיות חזק יותר בניהול מותגים או לשפר חוויות לקוח.
מניעת עומס יתר של מידע
אם יש לך כתובת דוא"ל שבה אתה משתמש עבור העבודה שלך, עומס יתר של מידע יכול להיראות בלתי נמנע. העובד הממוצע מקבל יותר מ-120 הודעות דוא"ל ביום, ולכן לא מפתיע שכ-60% מהעובדים פשוט מתעלמים מהודעות דוא"ל פנימיות של החברה. אבל אם ליישום הדוא"ל שלך יש יכולות NLP, זה יכול לעזור לך להימנע מעומס יתר של מידע. הוא יכול לסנן, לחלק לקטגוריות ולתעדף הודעות דוא"ל כך שהחשובים ביותר יקבלו את תשומת הלב הדרושה להם.
באופן דומה, מערכות NLP הבנויות בתוכנות שיתוף פעולה יכולות לתמלל ולסכם פגישות. הם יכולים אפילו לזהות וללכוד את נקודות המפתח שנעשו במהלך פגישה ולדווח על פריטי פעולה מוקצים. אוטומציה מותאמת NLP עוזרת לאנשים לחסוך זמן ומגדילה את היעילות הארגונית הכוללת.
מקרי שימוש של עיבוד שפה טבעית
NLP משנה תעשיות. יישומי NLP משפרים את יעילות העובדים, הופכים את חוויית הלקוח לטובה יותר ומאפשרים קבלת החלטות אסטרטגית, המשתרעת על מגוון רחב של מגזרים. להלן מספר מקרי שימוש בולטים עבור NLP בתעשיות שונות.
Defect analysis: Identifying common defects through analysis of technicians’ notes, customer complaints, and warranty claims
Supplier communication: Enabling timely material procurement through analysis of supplier emails and documents
Fraud detection: Identifying anomalies indicating fraud through transaction pattern monitoring and analysis
Trade acceleration: Automating trade execution based on real-time data analysis
Clinical documentation: Transcribing and managing clinical notes
Patient data analysis: Informing diagnoses through pattern identification in patient records
Contract analysis and compliance checking: Automating document review for regulatory and other compliance
Legal discovery automation: Isolating pertinent information from vast amounts of documents rapidly
Claims processing automation: Extracting and validating information from submitted claim forms and medical reports
Risk assessment: Improving risk assessment accuracy through automated extraction of data from medical records and lifestyle questionnaires
Maintenance log analysis: Analyzing notes from maintenance personnel to predict and prevent equipment failures
Geological data interpretation: Extracting and summarizing data from sources such as geological reports, drilling logs, and research papers
Property listing optimization: Generating engaging descriptions based on property features
Lead qualification: Analyzing email and online inquiries to prioritize based on readiness to purchase
Inventory optimization: Predicting demand through sales data analysis
Personalized product recommendations: Creating more personalized shopping experiences through purchase history analysis
גישות לעיבוד שפה טבעית
רוב הגישות לעיבוד שפה טבעית נופלות לאחת משתי קטגוריות רחבות. הם נוקטים בגישה מבוססת כללים או בגישה מבוססת למידת מכונה.
NLP מבוסס כללים
גישה זו מנסה לזהות סט של כללים לשוניים שמחשב יכול לציית להם כדי להבין באופן אמין ולייצר שפה אנושית. כתוצאה מכך, היא מכוונת מאוד כלפי היבטים לשוניים של בלשנות חישובית. גישות מבוססות כללים יכולות להיות יעילות ביותר אם אתה משתמש בסטים של נתונים שבהם השפה מבוקרת וגם ניתנת לחיזוי, כמו מסמכים משפטיים או מדריכים טכניים.
NLP מבוסס למידת מכונה
גישה מבוססת למידת מכונה ל-NLP משתמשת במגוון שיטות סטטיסטיות וגישות אלגוריתמיות. במקום ליצור את הכללים מראש, המטרה היא לאפשר למחשב ללמוד כיצד לתקשר על סמך סט נתונים מסיבי. הרעיון הוא שברגע שמחשב עיבד מספיק דוגמאות לשפה האנושית, יזהה המחשב את הדפוסים שעושים לשפה אנושית טובה. אם יש לך סטים גדולים מספיק של נתונים, גישות מבוססות למידת מכונה ל-NLP יכולות להיות גמישות למדי ויעילות במיוחד.
היסטוריה קצרה של עיבוד שפה טבעית
עיבוד שפה טבעית כענף של בינה מלאכותית החל להתפתח בשנות הארבעים. בשנות השמונים והתשעים הפכו פתרונות המחשוב לחזקים יותר ולמידת המכונה החלה להתבגר. לאחרונה, עלייתן של למידה עמוקה, רשתות עצביות וצורות שונות של בינה מלאכותית גנרטיבית שינתה לחלוטין את עיבוד השפה הטבעית.
אירועים באבולוציה של NLP
- שנות הארבעים | פיתוחים ראשונים של NLP, כולל מזכר ויבר על תרגום מכונה, מופיעים
- 1950 | הוצג "דקדוק אוניברסלי"; מבחן טיורינג הוצע; למידה עמוקה מתעוררת
- שנות השישים | Chatbots כגון ELIZA - התגבשות ותאוריות לשוניות המתבססות על NLP מתפתחות
- שנות השבעים | התגבשות תורת דקדוק המקרה ורשתות סמנטיות; מערכות מבוססות כללים בוגרות וצ'אטבוטים מתפשרות
- שנות השמונים | מתפתחים אלגוריתמים של למידת מכונה מוקדמת; טכנולוגיות זיהוי דיבור מתפתחות; בלשנות חישובית מתרחבת ותורת RNN מתעוררת
- שנות התשעים | מודלים סטטיסטיים ו-LSTMs מתגלים ומכונות זוכות רווחים מתרגום מכונה
- שנות האלפיים | למידת המכונה מתפתחת במהירות ומודלים של שפה עצבית מתפתחים; כמויות עצומות של נתונים מדוברים וטקסטואליים הופכות לנגישות
- 2010-0s | גידול משמעותי בנתונים זמינים וחישוב מאפשר ללמידה עמוקה להתפתח במהירות
- 2020 | מודלים גדולים של שפה, מודלים של שפות שעברו הכשרה מראש ושנאים זוכים להכרה
סקירה טכנולוגית של עיבוד שפה טבעית
עיבוד שפה טבעית הוא מונח מטריה המכסה מגוון טכנולוגיות וטכניקות המקנות למכונות להבין ולייצר שפה אנושית. כל טכנולוגיה המאפשרת NLP נופלת תחת אחת משתי היכולות הללו.
קטגוריות משנה NLP
עיבוד שפה טבעית מכסה מגוון טכנולוגיות וטכניקות. אבל המטרה העיקרית של NLP היא לאפשר למכונות להבין ולייצר שפה אנושית. שתי יכולות אלו הן המרכיבים העיקריים של עיבוד שפה טבעית.
- הבנת שפה טבעית (NLU): הבנת שפה טבעית מתמקדת בהבנה ובפירוש של השפה האנושית. כדי לעשות זאת, מערכות NLU חייבות להיות מסוגלות לנתח תחביר, לנתח סמנטיקה ולהבין את האופן שבו הקשר משפיע על המשמעות בשפה האנושית. זה עשוי לקחת צורות כגון הבנת שאלות מדוברות או ביצוע משימות בהתבסס על כיוונים מדוברים.
- יצירת שפה טבעית (NLG): יצירת שפה טבעית מתמקדת בהפקת טקסט או דיבור דמויי אדם. כדי לעשות זאת, מערכות NLG חייבות להיות מסוגלות להפוך נתונים לא מובנים לשפה תוחמת טבע. פירוש הדבר הוא סיכום מידע או אפילו ביצוע שיחות.
התפקיד של למידת מכונה ב-NLP
מה יכול היה מחשב לעשות אם הוא יכול ללמד את עצמו כישורים חדשים? זה מה שלמידת מכונה. למידת מכונה היא כאשר מחשבים לומדים לבצע משימות בעצמם ללא הוראות ספציפיות.
עבור NLP, למידת מכונה לוקחת את הצורה של יצירת מודלים המאפשרים הבנה של שפה טבעית וגם יצירת שפה טבעית. הוא משתמש בטכניקות כולל למידה מפוקחת, המתייחסת למודלי הכשרה בנתונים בעלי תוויות, ולמידה לא מפוקחת, שהיא מודלים של הכשרה בנתונים שאין להם תוויות.
תפקיד הלימוד העמוק ב-NLP
למידה עמוקה היא צורה ספציפית של למידת מכונה. הוא משתמש ברשתות עצביות בעלות שכבות מרובות, וזו הסיבה ש"עמוק" נמצא בשם. ה"למידה" מתייחסת לשימוש באלגוריתמים שמזהים ולאחר מכן מעצבים דפוסים מורכבים בסטים של נתונים. למידה עמוקה חשובה ב-NLP מכיוון שהיא הפכה את NLP להרבה יותר טובה במשימות מסוימות. אלה כוללים תרגום בין שפות, ניתוח הסנטימנט בסט נתונים ויצירת טקסט.
כיצד רשתות עצביות מרחיבות NLP
רשתות עצביות מבוססות על הרעיון של שימוש במוח האנושי כמודל לאופן עיבוד נתונים. רשתות עצביות מאפשרות למערכות NLP להיות מדויקות מאוד הן בהבנה והן ביצירת שפה אנושית. לרשתות עצביות יכולות להיות ארכיטקטורות שונות והן המפתח להפעלת יישומים כמו עוזר וירטואלי, צ'אטבוט או ניתוח טקסט אוטומטי.
גלו מה NLP יכול לעשות עבור העסק שלכם
פגוש את Joule: copilot של AI של SAP שיכול לעזור לכם לפתור אתגרים עסקיים קשים מהר יותר, חכמים יותר ועם תוצאות טובות יותר. רק תגיד את המילה.
בלשנות חישובית ו-NLP
בלשנות חישובית היא תחום המחקר המשלב בין מדעי המחשב לבלשנות כדי להתמקד בעיבוד שפה טבעית. הוא יוצר בסיס תאורטי המאפשר למחשבים להבין את השפה האנושית.
- תחביר
מחקרים מבנה המשפטים והכללים ההופכים משפטים לדקדוקיים או לא דקדוקיים.
תחביר באנגלית: "החתול יושב על המח".
תחביר שגוי באנגלית: "קט ה על החומר יושב".
- סמנטיקה
מחקרים משמעות בשפה, כולל האופן שבו מילים וביטויים מייצגים אובייקטים, פעולות ורעיונות.
משפט: "החתול על המח".
פרשנות סמנטית: המשמעות היא שיש חתול הממוקם פיזית על גבי מט.
- פרגמטיקה
מחקרים הדרך שבה הקשר משפיע על פרשנות השפה.
משפט: "את יכולה להעביר את המלח?"
פרשנות פרגמטית: למרות שזו שאלה לגבי היכולת, ההקשר מראה שצריך להבין שזו בקשה מנומסת שמישהו יעבור את המלח.
הבלשנות החישובית חשובה משום שהיא מחברת בין הנקודות בין התאוריה הלשונית ליישומים בעולם האמיתי של NLP.
שאלות נפוצות
4 שדות המשנה העיקריים הם:
1. הבנת שפה טבעית (NLU), תוך התמקדות באפשרות למחשבים להבין משמעות והכוונה מאחורי השפה
2. יצירת שפה טבעית (NLG) מאפשרת טקסט קריא מנתונים מובנים
3. זיהוי קולי ממיר שפה מדוברת להעתקה
4. סינתזת דיבור ממירה עותק (או טקסט כתוב) לשפה מדוברת