Co to jest przetwarzanie języka naturalnego?
Przetwarzanie języka naturalnego to forma uczenia maszynowego, która pozwala ludziom komunikować się ze sztuczną inteligencją (AI) za pomocą języka ludzkiego.
default
{}
default
{}
primary
default
{}
secondary
Przegląd dziedziny przetwarzania języka naturalnego (NLP)
Przegląd i definicja NLP
Przetwarzanie języka naturalnego (NLP) to fascynująca gałąź AI, która pozwala ludziom i maszynom komunikować się ze sobą w codziennym języku. Sposób przekazywania poleceń głosowych do Siri lub tłumaczenia za pomocą Google to przykłady NLP w działaniu, ponieważ pokazują, jak oprogramowanie rozumie i reaguje na język ludzki.
Jak przetwarzanie języka naturalnego wiąże się z AI?
Większość z nas nie jest programistami ani ekspertami od oprogramowania, co jest jednym z powodów, dla których przetwarzanie języka naturalnego jest tak przydatne. Nauczenie się obsługi oprogramowania może wymagać wiele wysiłku, a NLP pozwala na korzystanie nawet ze skomplikowanych rozwiązań, nawet jeśli nie jesteś ekspertem. W rzeczywistości NLP pozwala po prostu opisać AI, czego potrzebujesz, w taki sam sposób, w jaki możesz to wytłumaczyć znajomemu.
Termin „sztuczna inteligencja” obejmuje szeroki wachlarz technologii, ale gałąź przetwarzania języka naturalnego koncentruje się na wyzwaniach związanych z językiem ludzkim. Aby być naprawdę użytecznymi, rozwiązania NLP muszą robić więcej niż tylko wyłapywać słowa wypowiadane przez człowieka. Systemy NLP muszą rozumieć kontekst i intencję stojące za swoimi słowami. Aby to umożliwić, programiści NLP korzystają z innych technologii AI, takich jak uczenie maszynowe i głębokie uczenie.
Dlaczego przetwarzanie języka naturalnego jest ważne?
Przetwarzanie języka naturalnego pozwala na korzystanie z technologii, które w przeciwnym razie mogą być trudne w użyciu. Pozwala również komputerom zrozumieć tekst i mowę w sposób, który nie był możliwy przed rozwinięciem technologii NLP. Oto niektóre z zalet przetwarzania języka naturalnego:
NLP wspomaga produktywność
W pracy przetwarzanie języka naturalnego może zwiększyć wydajność, umożliwiając wykorzystanie automatyzacji do powtarzalnych lub czasochłonnych zadań. Na przykład dział obsługi klienta może używać chatbotów wspieranych przez NLP do obsługi rutynowych zapytań klientów. Dział księgowości może natomiast używać systemów wspomaganych NLP do wyciągania kluczowych informacji z faktur i rachunków przyjęć i przenoszenia ich do bazy danych lub arkusza kalkulacyjnego.
Dodatkowo automatyzacja wprowadzania i przetwarzania danych zmniejsza ryzyko błędu ludzkiego i przyspiesza przepływy pracy. Gdy system potrafi wystarczająco dobrze zrozumieć język ludzki, aby przejąć podstawowe zadania, zwiększa produktywność, umożliwiając użytkownikom skupienie się na zadaniach o wyższej wartości.
NLP pomaga poprawić doświadczenia klienta
Gdy próbujesz dodzwonić się do firmy, ale nie możesz przejść przez niejasne drzewo kontaktów, masz do czynienia ze słabo wytrenowanym interaktywnym systemem odpowiedzi głosowych (IVR). Dobrze wytrenowany chatbot NLP może jednak zapewnić klientom bardziej intuicyjne doświadczenia. Na przykład witryna e-commerce z systemem wspomaganym NLP może analizować, jakie produkty klient przeglądał na stronie. Dzięki zrozumieniu, które produkty interesują danego klienta, system może następnie zasugerować te, które klient prawdopodobnie zechce kupić.
Oparte na NLP chatboty do obsługi klienta poprawiają doświadczenia, szybko odpowiadając na pytania lub rozwiązując problemy. Te chatboty można zaprojektować tak, aby miały pełną historię interakcji z klientem i rozpoznawały problemy, jakich doświadczył w przeszłości.
NLP daje wgląd w nowe dane
Każdy kto kiedykolwiek wysłał e-mail do firmy, aby zadać pytanie, zaoferować poradę lub zgłosić reklamację, mógł odnieść wrażenie, że nikt nawet tego nie czyta. I możliwe że tak jest, ponieważ niewiele firm ma czas, aby czytać wszystkie wiadomości od klientów. AI wspomagane NLP ma ten czas. Może przebijać się przez ogromne zbiory danych, takie jak rozmowy z klientami na stronach internetowych. Dzięki temu firmy uzyskują wiarygodne podsumowanie tych dyskusji, co umożliwia im rozwiązanie problemu.
Jak działa przetwarzanie języka naturalnego?
Oto jak NLP umożliwia rozmowy między ludźmi a maszynami. Poniższe kroki mają zastosowanie do języka w formie tekstu. W przypadku języka mówionego NLP działa nieco inaczej, ale zgodnie z tymi samymi ogólnymi zasadami.
Spójrzmy na przykładowe zdanie, aby pokazać, jak działa ten proces:
„Lubię demonstrować, jak działa przetwarzania języka naturalnego”.
Algorytm rozpoczyna od wstępnego przetwarzania tekstu.
Wstępne przetwarzanie tekstu
Wstępne przetwarzanie tekstu odnosi się do uproszczenia tekstu tworzonego przez ludzi, aby ułatwić algorytmom NLP przetwarzanie języka ludzkiego.
- Tokenizacja
Tokenizacja to proces rozbijania słów i interpunkcji w zdaniu na tokeny. Tokenizacja jest ważna, ponieważ podczas wykonywania zadań takich jak indeksowanie i wyszukiwanie algorytmy NLP przetwarzają tokeny sprawniej niż tekst. Nasze przykładowe zdanie zawiera siedem słów: „Lubię demonstrować, jak działa przetwarzanie języka naturalnego”. Występuje w nim również przecinek i jest również zakończone kropką, co daje siedem tokenów wynikających z liczby słów oraz dwa odpowiadające przecinkowi i kropce, w sumie dziewięć tokenów.
- Lowercasing
Lowercasing to proces konwersji wszystkich tokenów na małe litery w celu uproszczenia zbioru danych. W naszym przykładowym zdaniu jednym z tokenów było słowo „Lubię”. Aby uniknąć niejednoznaczności i zwiększyć wydajność, na tym etapie wielkie litery w tokenach są zamieniane na małe — „lubię”. Zasady dotyczące zamiany na małe litery są bardziej skomplikowane w innych częściach procesu.
- Usuwanie słów stopujących
Innym sposobem uproszczenia tekstu na potrzeby przetwarzania języka naturalnego jest usunięcie słów, które nie mają dużego znaczenia, zwanych słowami stopującymi. W zdaniu przykładowym słowo „jak” zwykle zostałoby uznane za słowo stopujące. Gdy algorytm je usunie, pozostanie osiem tokenów: „lubię”, „demonstrować”, „działa”, „przetwarzanie”, „języka” i „naturalnego”.
- Stemming i lematyzacja
Nawet przy siedmiu tokenach można to zdanie jeszcze bardziej uprościć. Jedną z metod jest stemming, czyli skrócenia słowa do jego formy podstawowej lub jego rdzenia. Token „demonstrować” jest słowem, które opiera się na temacie„demonstr” tak samo jak „naturalnego”, bazuje na „natur”, więc model zastępuje oryginalne tokeny tematami „demonstr” i „natur”.
Słowo może przyjmować różne znaczenia w zależności od kontekstu, a lematyzacja jest procesem określania właściwego znaczenia w danym kontekście. Nasze przykładowe zdanie zawiera słowo „język”, które może odnosić się do komunikacji albo narządu znajdującego się w jamie ustnej. W tym przypadku lematyzacja skutkowałaby przypisaniem kontekstu, w którym „język” odnosi się do systemu budowania wypowiedzi.
Reprezentacja tekstu
Następnym krokiem jest reprezentacja tekstu, czyli konwersja słów na format numeryczny, który maszyna jest w stanie przetworzyć. Oprócz liczb tekst może być konwertowany na wektory lub osadzania, które są bardziej złożonymi formatami dostarczającymi na przykład informacji o kontekście.
- Bag of Words (BoW)
Komputery świetnie radzą sobie z obliczeniami, a metoda BoW liczy, ile razy dane słowo występuje w dokumencie. Jeśli w dokumencie często pojawiają się na przykład słowa: drużyna, mecz i wynik, prawdopodobnie kontekstem jest sport. W naszym przykładowym zdaniu każde słowo wystąpiło tylko raz. Reprezentacja BoW pokazuje, że każde słowo występuje tylko raz:
{„lubię”: 1, „demonstrować”: 1, „jak”: 1, „działa”: 1, „przetwarzanie”: 1, „języka”: 1, „naturalnego”: 1}
- TF-IDF (ważenie częstością termów — odwrotna częstość w dokumentach)
Metoda TF-IDF wykorzystuje formułę opartą na tym, jak często słowo pojawia się w zbiorze danych złożonym z wielu dokumentów, aby określić znaczenie tego słowa. Im częściej pojawia się słowo, tym mniejsza jest jego waga TF-IDF i tym mniej ważne jest ono w obrębie jednego dokumentu. Słowa takie jak „i” i „w” pojawiają się dość często, a więc są mniej istotne. Wagi w naszym zdaniu przedstawiane są mniej więcej w takiej formie, która pokazuje, że często występujące słowa mają niższe wagi, natomiast słowa stosowane często mają wagi wyższe:
{„lubię”: 0,1, „demonstrować”: 0,3, „jak”: 0,1, „działa”: 0,2, „przetwarzanie”: 0,5, „języka”: 0,2, „naturalnego”: 0,2}
Analiza tekstu
Analiza tekstu to moment, w którym algorytm NLP wyodrębnia znaczenie tekstu. Dzięki temu algorytm może wygenerować odpowiednie odpowiedzi na zapytanie użytkownika.
- Rozpoznawanie jednostek nazwanych (named entity recognition, NER)
Po przeprowadzeniu analizy ilościowej algorytmy NLP poszukują słów, które coś nazywają.- Słowo biedronka odnosi się do rodzaju owada, ale już słowo Biedronka odwołuje się do konkretnej firmy, a algorytm NLP musi być w stanie rozpoznać różnicę. Przykładowe zdanie „Lubię pokazywać, jak działa przetwarzanie języka naturalnego” zawiera słowa „przetwarzanie języka naturalnego”, które ludzie mogą uznać za odnoszące się do technologii AI. Przedstawia się to w następujący sposób:
Wynik metody NER: [(„przetwarzanie języka naturalnego”, „technologia”)]
- Analiza sentymentu
Niektóre zbiory danych, jak katalog części do kosiarek, mogą nie mieć wyraźnego tonu emocjonalnego. Ale już na przykład recenzja filmu — wręcz przeciwnie. Jeśli zbiór danych ma ton, analiza sentymentu w ramach przetwarzaniu języka naturalnego, ten ton wychwytuje. W przypadku naszego zdania analiza sentymentu może wyglądać następująco:
Ocena sentymentu: pozytywny
Analiza składni
Każde zdanie ma swoją strukturę gramatyczną. Analiza składni to proces analizowania tej struktury w celu zidentyfikowania rzeczowników, czasowników, podmiotów itp. Jest to ważne, ponieważ różne języki używają innej składni, więc analizowanie jej jest niezbędne do tłumaczenia maszynowego. Dla naszego przykładowego zdania analiza składni może wygenerować poniższy wynik:
Drzewo składniowe: (ROOT (S (NP (PRO Ja)) (VP (V lubię) (VP (V demonstrować) (SBAR (WHADVP (jak)) (S (VP (V działa) (NP (N przetwarzanie) (PP (P języka) (NP (ADJ naturalnego)))))))))))
W zależności od konkretnego algorytmu zazwyczaj będą występowały dodatkowe kroki. Rezultatem jest rozmowa, w której maszyna zdaje się rozumieć Twoje słowa i intencje i odpowiada Ci w języku naturalnym.
Jakie są przykłady zastosowań przetwarzania języka naturalnego?
Sterowanie dronem za pomocą poleceń głosowych
Nawet najpotężniejsza technologia ma ograniczoną wartość, jeśli nie wiesz, jak z niej korzystać. Przetwarzanie języka naturalnego sprawia, że technologia jest bardziej dostępna. Zmniejsza to zapotrzebowanie na specjalistyczną wiedzę techniczną w przypadku potrzeby skorzystania z zaawansowanego oprogramowania lub sprzętu. Użytkownicy mogą wchodzić w interakcje z systemami wspomaganymi NLP poprzez naturalną konwersację, zamiast polegać na złożonych poleceniach, kodowaniu lub sterowaniu ręcznym.
Na przykład aplikacja do zdalnego sterowania małymi dronami pozwala po prostu powiedzieć dronowi, aby obrócił się w powietrzu, bez konieczności uczenia się skomplikowanych poleceń, których w przeciwnym razie trzeba by było użyć. Możliwość korzystania z prostych poleceń głosowych czyni technologię dostępną dla większej liczby osób.
Lepszy wgląd w opinie o marce
Ludzie codziennie wyrażają swoje zdanie i preferencje, a firmy mają dostęp do wielu takich danych. Obecnie firmy korzystają już z danych, na przykład o sprzedaży produktów, aby zrozumieć niektóre aspekty zachowań klientów. Dzięki rozwiązaniom do przetwarzania języka naturalnego komputery mogą przekształcić również rozmowy w mediach społecznościowych i recenzje klientów online w przydatne informacje.
Dane wygenerowane dzięki NLP są innego rodzaju informacjami niż tradycyjne analizy sprzedażowe. Firma wykorzystuje dane dotyczące sprzedaży do analiz operacyjnych, takich jak prognozowanie lub zarządzanie zasobami, natomiast analiza oparta na NLP może być bardziej przydatna w zarządzaniu marką lub poprawiać doświadczenia klienta.
Zapobieganie przeciążeniu informacjami
Jeśli masz adres e-mail, z którego korzystasz w pracy, przeciążenie informacjami może się wydawać nieuniknione. Przeciętny pracownik otrzymuje ponad 120 e-maili dziennie, więc nic dziwnego, że około 60% pracowników po prostu ignoruje wewnętrzną komunikację mailową. Jeśli Twoja aplikacja poczty elektronicznej ma funkcje NLP, może pomóc uniknąć przeciążenia informacjami. Może filtrować, kategoryzować i priorytetyzować wiadomości, aby te najważniejsze nie zostały zignorowane.
Ponadto systemy NLP wbudowane w oprogramowanie do współpracy mają możliwość transkrypcji i podsumowania spotkań. Mogą nawet rozpoznawać i rejestrować kluczowe punkty podczas spotkania i spisywać zadania do wykonania wraz z przypisanymi do nich osobami. Ten rodzaj automatyzacji wspomagany NLP pomaga pracownikom zaoszczędzić czas i zwiększa ogólną efektywność organizacji.
Przykłady zastosowania przetwarzania języka naturalnego
NLP rewolucjonizuje branże. Aplikacje NLP zwiększają wydajność pracowników, poprawiają doświadczenia klientów i umożliwiają podejmowanie strategicznych decyzji w szerokim zakresie sektorów. Poniżej przedstawiono kilka wartych uwagi przypadków zastosowania NLP w różnych branżach.
Analiza wad: identyfikacja typowych wad poprzez analizę notatek techników, reklamacji klientów i roszczeń gwarancyjnych.
Komunikacja z dostawcami: umożliwienie terminowego nabycia materiałów poprzez analizę e-maili i dokumentów dostawców.
Wykrywanie nadużyć finansowych: identyfikacja anomalii wskazujących na nadużycia poprzez monitorowanie i analizę wzorców transakcji.
Przyspieszenie transakcji: automatyzacja realizacji transakcji na podstawie analizy danych w czasie rzeczywistym.
Dokumentacja kliniczna: transkrypcja uwag klinicznych i zarządzanie nimi.
Analiza danych pacjenta: wspomaganie procesu diagnozy poprzez identyfikację wzorców w dokumentacji pacjenta.
Analiza umów i kontrola zgodności: automatyzacja weryfikacji dokumentów pod kątem zgodności z przepisami.
Automatyzacja ujawnienia dokumentów prawnych: szybkie wyodrębnianie istotnych informacji z ogromnych ilości dokumentów.
Automatyzacja przetwarzania roszczeń: wyodrębnianie i walidacja informacji z przesłanych formularzy roszczeń oraz raportów medycznych.
Ocena ryzyka: poprawa dokładności oceny ryzyka poprzez automatyczne wyodrębnianie danych z dokumentacji medycznej i kwestionariuszy dotyczących stylu życia.
Analiza logu obsługi: analiza notatek personelu obsługi profilaktycznej w celu przewidywania awarii urządzeń i zapobiegania im.
Interpretacja danych geologicznych: wyodrębnianie i podsumowywanie danych ze źródeł takich jak raporty geologiczne, logi wiertnicze i dokumenty badawcze.
Optymalizacja ogłoszeń: generowanie atrakcyjnych opisów na podstawie cech nieruchomości.
Kwalifikacja potencjalnych szans: analiza wiadomości e-mail i zapytań online w celu zidentyfikowania priorytetowych szans na podstawie gotowości do zakupu.
Optymalizacja zapasów: prognozowanie popytu poprzez analizę danych sprzedażowych.
Spersonalizowane rekomendacje produktów: tworzenie bardziej spersonalizowanych doświadczeń zakupowych poprzez analizę historii zakupów.
Podejścia do przetwarzania języka naturalnego
Większość podejść do przetwarzania języka naturalnego należy do jednej z dwóch szerokich kategorii. Są to podejścia oparte na regułach lub na uczeniu maszynowym.
NLP oparte na regułach
Podejście to ma na celu zidentyfikowanie zbioru reguł językowych, z których komputer jest w stanie korzystać przestrzegać, aby wiarygodnie zrozumieć i wygenerować język ludzki. W rezultacie jest on mocno zorientowany na językowe aspekty lingwistyki obliczeniowej. Podejścia oparte na regułach mogą być bardzo skuteczne, jeśli korzystasz ze zbiorów danych, w których język jest zarówno kontrolowany, jak i przewidywalny, takich jak dokumenty prawne lub podręczniki techniczne.
NLP oparte na uczeniu maszynowym
Podejście do NLP oparte na uczeniu maszynowym wykorzystuje różne metody statystyczne i podejścia algorytmiczne. Zamiast tworzyć reguły z wyprzedzeniem, ma umożliwić komputerowi nauczenie się komunikacji na podstawie ogromnego zbioru danych. Chodzi o to, że gdy komputer przetworzy wystarczająco dużo przykładów języka ludzkiego, zidentyfikuje wzorce, które tworzą dobrej jakości język ludzki. Jeśli masz wystarczająco dużo zbiorów danych, podejście do NLP oparte na uczeniu maszynowym może być stosunkowo elastyczne i niezwykle skuteczne.
Krótka historia przetwarzania języka naturalnego
Przetwarzanie języka naturalnego jako gałąź AI zaczęło się rozwijać w latach 40. XX wieku. W latach 80. i 90. rozwiązania obliczeniowe stały się bardziej wydajne, a uczenie maszynowe zaczęło dojrzewać. Ostatnio rozwój głębokiego uczenia się, sieci neuronowych i różnych form generatywnej AI całkowicie zrewolucjonizował przetwarzanie języka naturalnego.
Wydarzenia w ewolucji NLP
- Lata 40. XX wieku | Pojawiają się pierwsze projekty NLP, w tym Weaver Memorandum poświęcony tłumaczeniu maszynowemu.
- Lata 50. XX wieku | Wprowadzono koncepcję „gramatyki uniwersalnej”; zaproponowano test Turinga; początek głębokiego uczenia się.
- Lata 60. XX wieku | Pojawiają się chatboty takie jak ELIZA oraz rozwijają się teorie językowe leżące u podstaw NLP.
- Lata 70. XX wieku | Rozwijają się teoria gramatyki przypadków i sieci semantyczne; systemy oparte na regułach dojrzewają i pojawia się coraz więcej chatbotów.
- Lata 80. XX wieku| Rozwijają się wczesne algorytmy uczenia maszynowego; ewoluują technologie rozpoznawania mowy; rozwija się również lingwistyka obliczeniowa; powstaje teoria rekurencyjnej sieci neuronowej (RNN).
- Lata 90. XX wieku | Pojawiają się modele statystyczne i LSTM, a rozwój tłumaczenia maszynowego znacznie przyspiesza.
- Lata 2000. | Ma miejsce dynamiczny rozwój uczenia maszynowego i rozwijają się neuronowe modele językowe; dostępne stają się ogromne ilości danych mówionych i tekstowych.
- Lata 10. XX wieku | Znaczny wzrost dostępnych danych i mocy obliczeniowej umożliwia szybki rozwój głębokiego uczenia się.
- Lata 20. XX wieku | Na znaczeniu zyskują duże modele językowe, wstępnie wytrenowane modele językowe i transformatory.
Przegląd technologii przetwarzania języka naturalnego
Przetwarzanie języka naturalnego jest pojęciem zbiorczym obejmującym szereg technologii i technik, które umożliwiają maszynom zrozumienie i wytwarzanie języka ludzkiego. Każda technologia, która umożliwia NLP, spełnia jedną z tych dwóch funkcji.
Podkategorie NLP
Przetwarzanie języka naturalnego obejmuje szereg technologii i technik. Głównym celem NLP jest jednak umożliwienie maszynom zrozumienia i wyprodukowania języka ludzkiego. Te dwie funkcje są głównymi składnikami przetwarzania języka naturalnego.
- Zrozumienie języka naturalnego (NLU): zrozumienie języka naturalnego to proces zrozumienia i interpretacji języka ludzkiego. Aby to zrobić, systemy NLU muszą być w stanie analizować składnię oraz semantykę i rozumieć, w jaki sposób kontekst wpływa na znaczenie w języku ludzkim. Może to przybierać formy, takie jak rozumienie pytań mówionych lub wykonywanie zadań na podstawie wypowiadanych poleceń.
- Generowanie języka naturalnego (NLG): generowanie języka naturalnego polega na wytwarzaniu tekstu lub mowy przypominających człowieka. Aby to zrobić, systemy NLG muszą być w stanie przekształcić nieustrukturyzowane dane w naturalnie brzmiący język. Może to oznaczać podsumowanie informacji lub nawet prowadzenie rozmów.
Rola uczenia maszynowego w NLP
Co mógłby zrobić komputer, gdyby mógł nauczyć się nowych umiejętności? To właśnie jest uczenie maszynowe. O uczeniu maszynowym mówimy wtedy, gdy komputery uczą się samodzielnie wykonywać zadania bez żadnych szczegółowych instrukcji.
W przypadku NLP uczenie maszynowe przybiera formę tworzenia modeli, które umożliwiają zarówno zrozumienie języka naturalnego, jak i jego generowanie. Wykorzystuje różne techniki, w tym uczenie nadzorowane, które odnosi się do modeli analizy na danych, które mają etykiety, oraz uczenie nienadzorowane, czyli modele analizy na danych, które nie mają etykiet.
Rola głębokiego uczenia się w NLP
Głębokie uczenie się jest specyficzną formą uczenia maszynowego. Wykorzystuje sieci neuronowe, które mają wiele warstw, stąd określenie „głębokie”. „Uczenie się” odnosi się do wykorzystania algorytmów, które identyfikują, a następnie modelują złożone wzorce w zbiorach danych. Głębokie uczenie się odgrywa istotną rolę w NLP, ponieważ sprawia, że znacznie lepiej radzi sobie w określonych zadaniach. Należą do nich tłumaczenie między językami, analiza sentymentów w zbiorze danych i generowanie tekstu.
Jak sieci neuronowe wzmacniają NLP
Sieci neuronowe opierają się na koncepcji wykorzystania ludzkiego mózgu jako modelu przetwarzania danych. Sprawiają, że systemy NLP są bardzo dokładne zarówno w zrozumieniu, jak i generowaniu języka ludzkiego. Sieci neuronowe mogą mieć różne architektury i są kluczem do tworzenia aplikacji, takich jak wirtualny asystent, chatbot lub zautomatyzowana analiza tekstu.
Dowiedz się, co NLP może zrobić dla Twojej firmy
Poznaj Joule — asystenta AI firmy SAP, który może pomóc w szybszym i inteligentniejszym rozwiązywaniu trudnych problemów biznesowych z lepszym rezultatem. Wystarczy jedno słowo.
Lingwistyka obliczeniowa i NLP
Lingwistyka obliczeniowa to dziedzina badań, która łączy informatykę i lingwistykę i skupia się na przetwarzaniu języka naturalnego. Tworzy teoretyczną podstawę umożliwiającą komputerom zrozumienie języka ludzkiego.
- Składnia
Analizuje strukturę zdań i zasady, które czynią zdania gramatycznie poprawnymi lub niepoprawnymi.
Angielska składnia: „The cat sits on the mat”.
Niepoprawna angielska składnia: „Cat the on mat sits”.
- Semantyka
Dziedzina zajmująca się znaczeniem języka, w tym sposobem, w jaki słowa i zwroty reprezentują przedmioty, działania i idee.
Angielskie zdanie: „The cat is on the mat”.
Interpretacja semantyczna: zdanie to oznacza, że na macie znajduje się kot.
- Pragmatyka
Dziedzina badająca sposób, w jaki kontekst wpływa na interpretację języka.
Zdanie: „Czy mógłbyś podać sól?”
Interpretacja pragmatyczna: chociaż jest to pytanie o możliwość, z kontekstu wynika, że należy zrozumieć, że jest to uprzejma prośba o podanie soli.
Lingwistyka obliczeniowa jest ważną dziedziną, ponieważ łączy kropki między teorią językową a rzeczywistymi zastosowaniami NLP.
Często zadawane pytania
Cztery główne poddziedziny to:
1. Zrozumienie języka naturalnego (NLU), koncentrujące się na umożliwieniu komputerom zrozumienia znaczenia języka i stojących za nim intencji.
2. Generowanie języka naturalnego (NLG) umożliwia produkowani czytelnego dla człowieka tekstu z danych ustrukturyzowanych.
3. Rozpoznawanie mowy konwertuje język mówiony na tekst.
4. Synteza mowy konwertuje tekst (lub treść pisemną) na język mówiony.