flex-height
text-black

To dataloger opdaterer kode til behandling af naturligt sprog

Hvad er naturlig sprogbehandling?

Behandling af naturligt sprog er en form for maskinindlæring, der gør det muligt for folk at kommunikere med kunstig intelligens (AI) ved hjælp af menneskesprog.

Oversigt over behandling af naturligt sprog

Oversigt og definition af NLP

Naturlig sprogbehandling (NLP) er en fascinerende gren af AI, der gør det muligt for mennesker og maskiner at kommunikere med hinanden i dagligdags sprog. Den måde, du giver stemmekommandoer til Siri eller får oversættelser på Google, er begge eksempler på NLP i aktion, fordi både viser softwareforståelse og reagerer på det menneskelige sprog.

Hvordan forholder NLP sig til AI?

De fleste mennesker er ikke programmører eller software power-brugere, hvilket er en af grundene til, at naturlig sprogbehandling er så nyttig. Software kan have en stejl læringskurve, og NLP giver dig mulighed for at bruge selv kompleks software uden at blive ekspert. Faktisk giver NLP dig mulighed for blot at beskrive, hvad du vil have til en AI på samme måde, som du måske forklarer det til en ven.

Begrebet AI daekker over en bred vifte af teknologier, men NLP-grenen fokuserer på det menneskelige sprogs udfordringer. For at være virkelig nyttige, NLP løsninger er nødt til at gøre mere end bare fange de ord, du siger. NLP-systemer skal forstå konteksten og hensigten bag dine ord. For at gøre det muligt bruger NLP-udviklere andre AI-teknologier som maskinlæring og dyb læring.

Hvorfor er behandling af naturligt sprog vigtigt?

Naturlig sprogbehandling giver dig mulighed for at bruge teknologi, der ellers kan vaere vanskelig at bruge. Det giver også computere mulighed for at forstå tekst og tale på en måde, som de ikke kunne før NLP. Her er nogle af fordelene ved NLP:

NLP hjælper folk med at være mere produktive

På arbejdet kan naturlig sprogbehandling øge din effektivitet ved at give dig mulighed for at bruge automatisering til gentagne eller tidskrævende opgaver. For eksempel kan en kundeserviceafdeling bruge NLP-drevne chatbots til at håndtere rutinemæssige kundeforespørgsler. Eller en regnskabsafdeling kan bruge NLP-aktiverede systemer til at hente vigtige oplysninger fra fakturaer og kvitteringer og bruge dem til at udfylde en database eller et regneark.

Som yderligere fordele reducerer automatisering af dataindtastning og -behandling chancerne for menneskelige fejl og fremskynder arbejdsgange. Når et system kan forstå menneskesproget godt nok til at overtage basale opgaver, øger det produktiviteten ved at give brugerne mulighed for at fokusere på opgaver med højere vaerdi.

NLP hjælper med at forbedre kundeoplevelser

Når du forsøger at nå en virksomhed via telefon, men ikke kan komme forbi et forvirrende telefontræ, oplever du et dårligt uddannet interaktivt stemmesvarsystem. Men en veluddannet NLP-chatbot kan give kunderne en mere intuitiv oplevelse. Et e-handelswebsted med et NLP-aktiveret system kan f.eks. analysere, hvilke produkter en kunde har gennemset på webstedet. Ved at forstå, hvilke produkter der er af interesse for en kunde, kan systemet så foreslå produkter, som kunden sandsynligvis vil have.

NLP-drevne kundeservice chatbots forbedrer oplevelser ved at besvare spørgsmål eller løse problemer hurtigt. Disse chatbots kan designes til at have en komplet historik over en kundes interaktioner og genkende problemer kunden tidligere har haft.

NLP skaber ny indsigt

Hvis du nogensinde har sendt en e-mail til en virksomhed for at stille et spørgsmål, tilbyde rådgivning eller registrere en klage, kan det virke som om ingen selv læser det. Og det kan være tilfældet, fordi få virksomheder har tid til at læse hvert eneste stykke kundefeedback, de får. Men NLP-aktiveret AI har tiden. Det kan gennemsøge enorme datasæt som kundesamtaler på websteder. Det kan så give virksomhederne et pålideligt sammendrag af disse drøftelser, så forretningen kan rette op på problemet.

Hvordan fungerer behandling af naturligt sprog?

Sådan gør NLP menneske- og maskinsamtaler mulige. Følgende trin gælder for sprog i form af tekst. NLP for talt sprog er lidt anderledes men følger de samme generelle principper.

Lad os bruge en eksempelsætning til at vise, hvordan processen fungerer:

"Jeg kan godt lide at demonstrere, hvordan naturlig sprogbehandling fungerer."

Algoritmen starter med tekstforbehandling.

Tekstforbehandling

Tekstforbehandling henviser til at forenkle den tekst, folk skaber, for at gøre det nemmere for NLP-algoritmer at behandle menneskesprog.

Tokenisering er processen med at nedbryde ord og tegnsætning i en sætning i tokens. Tokenisering er vigtigt, fordi det er mere effektivt for NLP-algoritmer at behandle tokens end tekst, når du udfører opgaver som indeksering og søgning. Eksempelsætningen har otte ord i sig: "Jeg kan godt lide at demonstrere, hvordan naturlig sprogbehandling fungerer." Det har også en periode, så du får otte tokens ved at tælle ordene og en ved at tælle perioden, for i alt ni tokens.

Små bogstaver er processen med at konvertere alle tokens til tokens med små bogstaver for at gøre datasættet enklere. I eksempelsætningen var en af tokens "I". For at undgå tvetydighed og øge effektiviteten konverterer trinnet med små bogstaver disse store bogstaver til "i". Reglerne for sænkning bliver mere komplicerede i andre dele af processen.

En anden måde at forenkle tekst til behandling af naturligt sprog er at fjerne ord, der ikke har nogen væsentlig betydning, som kaldes stopord. I eksempelsætningen vil ordene "i" og "hvordan" typisk blive betegnet som stopord. Når en algoritme fjerner dem, har du syv tokens tilbage, som er "som", "demonstrerer", "naturlig", "sprog", "behandling", "værker" og ".".

Selv med de syv resterende tokens er der plads til mere forenkling. En metode, stemming, er at skære et ord ned til sin base eller rodform. Tegnet ”demonstrerende” er et ord, der bygger på stammen ”demonstr” ligesom ”naturlig” bygger på ”natur”, så modellen erstatter de oprindelige tokens med stilkene ”demonstr” og ”natur”.

Et ord kan have forskellige betydninger i forskellige sammenhaenge, og lemmatisering er processen med at bestemme den rigtige betydning i en bestemt kontekst. Eksempelsætningen omfatter "lignende", som kan betyde "nyd" eller "ligner". I dette tilfælde vil lemmatisering resultere i tildeling af den kontekst, hvor "synes godt om" betyder "nyde".

Tekstpræsentation

Næste trin er tekstrepræsentation, som konverterer ord til et numerisk format, som en maskine kan behandle. Ud over tal kan tekst konverteres til vektorer eller indlejringer, som er mere komplekse formater, der giver oplysninger som kontekst.

Computere er gode til at tælle, og BoW-målingen tæller, hvor mange gange et ord vises i et dokument. Hvis ordene hold, spil og score vises ofte i et dokument, for eksempel, er konteksten mere tilbøjelig til at være sport. Eksempelsætningen har kun én forekomst af hvert ord. BoW-repræsentationen ville vise, at hvert ord kun forekommer én gang som dette:

{"i": 1, "synes godt om": 1, "demonstrerer": 1, "hvordan": 1, "naturlig": 1, "sprog": 1, "behandling": 1, "virker": 1}

TF-IDF bruger en formel baseret på, hvor ofte et ord vises i et overordnet datasæt, der består af mange dokumenter for at bestemme et ords vigtighed. Jo oftere et ord dukker op, jo lavere sin TF-IDF-vaegt, og jo mindre vigtigt er det i et enkelt dokument. Ord som "the" og "a" vises ret ofte, og det er også mindre vigtigt. Du ville repræsentere vægtene af eksempelsætningen i en form, der viser, at almindelige ord har lavere vægt og usædvanlige ord har højere vægt:

{"i": 0.1, "like": 0.1, "demonstrerende": 0.3, "hvordan": 0.1, "naturlig": 0,2, "sprog": 0,2, "behandling": 0,5, "værker": 0.1}

Tekstanalyse

Tekstanalyse er det punkt, hvor en NLP-algoritme udtrækker betydning fra tekst. Det er sådan, en algoritme kan producere passende svar på brugerens forespørgsel.

Efter at have lavet nogle kvantitative analyser ser NLP-algoritmer naesten efter ord, der er genkendelige som navngivning af noget. Ordet æble refererer til en type frugt, men ordet Apple refererer til en bestemt virksomhed, og en NLP algoritme har brug for en måde at genkende forskellen. Eksempelsætningen "Jeg kan godt lide at demonstrere, hvordan behandling af naturligt sprog fungerer" omfatter ordene "behandling af naturligt sprog", som folk kan genkende som navngivning af en AI-teknologi. Dette repræsenteres som følger:

NER-output: [("behandling af naturligt sprog", "teknologi")]

Nogle datasæt, som et katalog af plæneklippere dele, har muligvis ikke en betydelig følelsesmæssig tone. Men en filmanmeldelse kan have en stærk følelsesmæssig tone. Hvis et datasæt har en tone, er følelsesanalyse det trin i behandlingen af naturligt sprog, der registrerer det. For eksempelsætningen kan følelsesanalysen se sådan ud:

Følelsesoutput: Positiv

Syntaksanalyse

Hver sætning har en grammatisk struktur. Syntaksparsing er processen med at analysere den struktur for at finde navneord, verber, emner osv. Dette er vigtigt, fordi forskellige sprog bruger forskellig syntaks, så syntaksanalyse er afgørende for maskinoversættelse. For eksempelsætningen kan syntaksanalyse generere dette resultat:

Syntakstræ: (ROOT (S (NP (PRP I)) (VP (VBP like) (S (VP (VBG demonstrating) (SBAR (WHADVP (WRB how)) (S (NP (NNP Natural) (NNP Language) (NNP Processing)) (VP (VBZ works)))))))))

Afhængigt af den specifikke algoritme vil der typisk være yderligere trin. Resultatet er en samtale, hvor maskinen ser ud til at forstå dine ord og hensigt og reagerer på dig i naturligt sprog.

Hvad er eksempler på opgaver i forbindelse med behandling af naturligt sprog?

Kontrol af en drone med stemmekommandoer

Selv den mest kraftfulde teknologi har begraenset vaerdi, hvis man ikke ved, hvordan man bruger den. Behandling af naturligt sprog gør teknologien mere tilgængelig. Det reducerer behovet for specialiseret teknisk viden for at få fordelene ved avanceret software eller hardware. Brugere kan interagere med NLP-aktiverede systemer gennem naturlig samtale i stedet for at stole på komplekse kommandoer, kodning eller fysiske kontroller.

For eksempel kan en fjernbetjeningsapplikation til små droner give dig mulighed for blot at fortælle en drone at gøre noget som at vippe i luften, uden at du behøver at lære de indviklede kontroller, du ellers ville have brug for at bruge. Muligheden for at bruge simple stemmekommandoer gør det muligt for flere at bruge teknologi.

Få bedre indsigt i brandstyring

Folk udtrykker deres tanker og præferencer hver dag, og virksomheder har adgang til en stor del af disse data. Virksomheder bruger allerede data som f.eks. produktsalg til at forstå nogle aspekter af kundeadfærd. Med naturlige sprogbehandlingsløsninger kan computere forvandle samtaler på sociale medier og online kundeanmeldelser til handlingsrettet information.

Indsigten fra NLP er en anden form for information end traditionel salgsanalyse. Virksomhedernes salgstal bruges til driftsmæssig indsigt som prognoser eller ressourcestyring, men NLP-baserede analyser kan være mere effektive inden for brandstyring eller forbedring af kundeoplevelser.

Forhindrer overbelastning af oplysninger

Hvis du har en e-mailadresse, som du bruger til dit job, kan overbelastning af oplysninger virke uundgåelig. Den gennemsnitlige medarbejder modtager mere end 120 e-mails om dagen, så det er ikke overraskende, at omkring 60 % af medarbejderne blot ignorerer interne virksomhedsmails. Men hvis din e-mail-applikation har NLP-muligheder, kan det hjælpe dig med at undgå overbelastning af oplysninger. Det kan filtrere, kategorisere og prioritere e-mails, så de vigtigste får den opmaerksomhed, de har brug for.

På samme måde kan NLP-systemer indbygget i samarbejdssoftware transskribere og opsummere møder. De kan endda genkende og registrere de vigtigste punkter, der er foretaget under et møde, og rapportere om tildelte handlingspunkter. Denne form for NLP-aktiveret automatisering hjælper enkeltpersoner med at spare tid og øger den overordnede organisatoriske effektivitet.

Anvendelseseksempler for behandling af naturligt sprog

NLP er i gang med at transformere industrier. NLP-applikationer forbedrer medarbejdernes effektivitet, gør kundeoplevelser bedre og muliggør strategisk beslutningstagning, der spænder over en bred vifte af sektorer. Nedenfor er nogle bemærkelsesværdige use cases for NLP på tværs af forskellige brancher.

Industry
Benefits of NLP
Automotive manufacturing

Defect analysis: Identifying common defects through analysis of technicians’ notes, customer complaints, and warranty claims

Supplier communication: Enabling timely material procurement through analysis of supplier emails and documents

Finance

Fraud detection: Identifying anomalies indicating fraud through transaction pattern monitoring and analysis

Trade acceleration: Automating trade execution based on real-time data analysis

Healthcare

Clinical documentation: Transcribing and managing clinical notes

Patient data analysis: Informing diagnoses through pattern identification in patient records

Legal

Contract analysis and compliance checking: Automating document review for regulatory and other compliance

Legal discovery automation: Isolating pertinent information from vast amounts of documents rapidly

Life and health insurance

Claims processing automation: Extracting and validating information from submitted claim forms and medical reports

Risk assessment: Improving risk assessment accuracy through automated extraction of data from medical records and lifestyle questionnaires

Oil and gas

Maintenance log analysis: Analyzing notes from maintenance personnel to predict and prevent equipment failures

Geological data interpretation: Extracting and summarizing data from sources such as geological reports, drilling logs, and research papers

Real estate

Property listing optimization: Generating engaging descriptions based on property features

Lead qualification: Analyzing email and online inquiries to prioritize based on readiness to purchase

Retail

Inventory optimization: Predicting demand through sales data analysis

Personalized product recommendations: Creating more personalized shopping experiences through purchase history analysis

Metoder til behandling af naturligt sprog

De fleste tilgange til behandling af naturligt sprog falder inden for en af to brede kategorier. De anvender enten en regelbaseret tilgang eller en maskinindlæringsbaseret tilgang.

Regelbaseret NLP

Denne tilgang forsøger at identificere et sæt sproglige regler, som en computer kan følge for pålideligt at forstå og generere menneskelige sprog. Som et resultat heraf er den stærkt orienteret mod sproglige aspekter af computersprogvidenskab. Regelbaserede tilgange kan være meget effektive, hvis du bruger datasæt, hvor sproget er både kontrolleret og forudsigeligt, som juridiske dokumenter eller tekniske manualer.

Maskinindlæringsbaseret NLP

En maskinindlæringsbaseret tilgang til NLP anvender en række statistiske metoder og algoritmiske tilgange. I stedet for at skabe reglerne på forhånd, er målet at tillade en computer at lære at kommunikere baseret på et massivt datasæt. Ideen er, at når en computer har bearbejdet nok eksempler på menneskesprog, vil computeren identificere de mønstre, der gør for godt menneskesprog. Hvis du har store nok datasæt, kan maskinindlæringsbaserede tilgange til NLP være ret fleksible og bemærkelsesværdigt effektive.

En kort historie om naturlig sprogbehandling

Naturlig sprogbehandling som en gren af AI begyndte at udvikle sig i 1940'erne. I 1980'erne og 1990'erne blev computerløsninger mere kraftfulde, og maskinindlæring begyndte at modnes. På det seneste har fremkomsten af dyb læring, neurale netværk og forskellige former for generativ AI fuldstændig ændret naturlig sprogbehandling.

Begivenheder i NLP-udvikling

Teknologioversigt over behandling af naturligt sprog

Naturlig sprogbehandling er et paraplybegreb, der daekker over en raekke teknologier og teknikker, der gør det muligt for maskiner at forstå og producere menneskesprog. Enhver teknologi, der gør det muligt for NLP, falder ind under en af disse to kapaciteter.

NLP-underkategorier

Behandling af naturligt sprog dækker over en række teknologier og teknikker. Men det primaere formål med NLP er at gøre det muligt for maskiner at forstå og producere menneskesprog. Disse to muligheder er de vigtigste komponenter i naturlig sprogbehandling.

Maskinindlæringens rolle i NLP

Hvad kunne en computer gøre, hvis den kunne lære sig selv nye færdigheder? Det er, hvad maskinindlæring er. Maskinlæring er, når computere lærer at udføre opgaver på egen hånd uden specifikke instruktioner.

For NLP tager maskinindlæring form af at skabe modeller, der muliggør både naturlig sprogforståelse og generering af naturligt sprog. Det bruger teknikker, herunder overvåget læring, som refererer til træningsmodeller på data, der har etiketter, og uovervåget læring, som er træningsmodeller på data, der ikke har etiketter.

Rollen som dyb læring i NLP

Deep learning er en specifik form for maskinindlæring. Det bruger neurale netværk, der har flere lag, hvilket er grunden til "dyb" er i navnet. "Læring" henviser til brugen af algoritmer, der identificerer og derefter modellerer komplekse mønstre i datasæt. Dyb læring er vigtig i NLP, fordi det har gjort NLP meget bedre til visse opgaver. Disse omfatter oversættelse mellem sprog, analyse af følelsen i et datasæt og generering af tekst.

Hvordan neurale netværk forbedrer NLP

Neurale netværk er baseret på ideen om at bruge den menneskelige hjerne som en model for, hvordan man behandler data. Neurale netværk gør det muligt for NLP-systemer at være meget nøjagtige i både forståelse og generering af menneskelige sprog. Neurale netværk kan have forskellige arkitekturer og er nøglen til at aktivere applikationer som en virtuel assistent, chatbot eller automatiseret tekstanalyse.

SAP-logo

Find ud af, hvad NLP kan gøre for din virksomhed

Mød Joule: SAP's AI copilot, der kan hjælpe dig med at løse vanskelige forretningsudfordringer hurtigere, smartere og med bedre resultater. Bare sig ordet.

Start samtalen

Computerlingvistik og NLP

Computational lingvistik er det studieområde, der kombinerer datalogi og lingvistik for at fokusere på naturlig sprogbehandling. Det skaber et teoretisk grundlag for at gøre computere i stand til at forstå det menneskelige sprog.

Undersøger strukturen af sætninger og de regler, der gør sætninger grammatiske eller ugrammatiske.

Engelsk syntaks: “Katten sidder på måtten.”

Forkert engelsk syntaks: “Cat the on mat sidder.”

Studier mening i sprog, herunder hvordan ord og sætninger repræsenterer objekter, handlinger og ideer.

Sentence: “Katten er på måtten.”

Semantisk fortolkning: Betydningen er, at der er en kat fysisk placeret oven på en måtte.

Undersøger den måde, hvorpå kontekst påvirker fortolkningen af sproget.

Sentence: ”Kan du passere saltet?”

Pragmatisk fortolkning: Selvom det er et spørgsmål om evne, viser konteksten, at du skal forstå det er en høflig anmodning til nogen om at passere saltet.

Computational lingvistik er vigtigt, fordi det forbinder prikkerne mellem sproglig teori og virkelige anvendelser af NLP.

Ofte stillede spørgsmål

Hvorfor er NLP svært?
Naturlig sprogbehandling (NLP) er utrolig udfordrende på grund af det menneskelige sprogs tvetydighed og kompleksitet. Ord kan have flere betydninger afhaengig af kontekst, grammatik kan nuanceres og uregelmaessigt, og små variationer i saetninger kan drastisk aendre den tilsigtede betydning. Og mangfoldigheden af sprog, dialekter og kulturelle nuancer gør det vanskeligt at udvikle universelt anvendelige modeller.
Hvad er de fire typer af NLP?

De 4 vigtigste underfelter er:

1.  Naturlig sprogforståelse (NLU), med fokus på at gøre computere i stand til at forstå mening og hensigt bag sprog
2. Generering af naturligt sprog (NLG) muliggør tekst, der kan læses af mennesker, fra strukturerede data
3. Talegenkendelse konverterer talt sprog til kopiering
4. Talesyntesen konverterer kopi (eller skriftlig tekst) til talt sprog

Læs mere

tags
4187ae8c-cd0e-40c1-9c57-b7f4b964faed:1b3c5a48-ceb7-41ef-9ef4-ed3056aa76d4/80703328-4f70-42b5-bb93-a92442818df8
limit
3
info
publicationDate