AI verzamelt heel erg veel data, uit sensoren, camera’s, satellietbeelden en nog veel meer. Het probleem is alleen dat dit heel ongestructureerd is. Daardoor is het ophalen van relevante informatie heel erg moeilijk. Daarvoor is Natural Language Processing.
Met Natural Language Processing (natuurlijke taalverwerking) halen we de belangrijkste informatie uit ongestructureerde data. Dat doet het door het combineren van machine learning (zie machine learning) en statische technieken.
Statische technieken zijn technieken die zijn bedacht in de statische wetenschap. Ze zijn bedoeld voor (makkelijk gezegd) het trekken van conclusies. Het helpt om een nieuwe waarneming te bepalen en bij welke van de van te voren bedachte groepen deze waarnemingen het beste passen.
Enkele voorbeelden van statische technieken zijn:
Dan is nu nog de vraag: “Hoe werkt Natural Language Processing nou in de praktijk?”.
Een van de meest bekende voorbeelden van Natural Language Processing is ChatGPT. De modellen voorspellen kans van de mogelijke woorden op basis van de tekst die de gebruiker het geeft. Dat is dan ook de reden dat je bij ChatGPT het antwoord woord voor woord ziet verschijnen.
Dit is het concept waarbij AI woorden/ woordcombinaties leert herkennen die belangrijk zijn voor het ordenen van de data. Dan kan het naar de juiste persoon worden doorgestuurd en dit bespaart veel tijd. Dit zie je bijvoorbeeld terug bij gmail- de spamfolder, dit is ook een vorm van berichten filteren. Maar denk ook aan de klantenservice waar natuurlijk extreem veel berichten binnenkomen van klanten.
Deze analyse is bedoeld voor het “filteren” van emoties uit een tekst. Dit gaat dan bijvoorbeeld over dingen als meningen over een product dat gekocht word, maar ook meningen op sociale media. Dit is heel erg waardevol. Het kan bijvoorbeeld gebruikt worden voor het verbeteren van ene product of het sturen van andere processen.