Prelucrarea limbajului natural (NLP) - KamilTaylan.blog
1 mai 2021 18:32

Prelucrarea limbajului natural (NLP)

Procesarea limbajului natural (NLP) este un domeniu al inteligenței artificiale care permite computerelor să analizeze și să înțeleagă limbajul uman. A fost formulat pentru a crea software care generează și înțelege limbaje naturale, astfel încât un utilizator să poată purta conversații naturale cu un computer în loc de programare sau limbaje artificiale precum Java sau C.

Defalcarea procesării limbajului natural (NLP)

Procesarea limbajului natural (NLP) este un pas într-o misiune mai largă pentru sectorul tehnologic – și anume, utilizarea  inteligenței artificiale (AI) pentru a simplifica modul în care funcționează lumea. Lumea digitală s-a dovedit a fi un schimbător de jocuri pentru o mulțime de companii, întrucât o populație din ce în ce mai experimentată din punct de vedere tehnologic găsește noi modalități de interacțiune online între ele și cu companiile. Rețelele sociale au redefinit semnificația comunității; criptomoneda a schimbat norma de plată digitală; Comerțul electronic a creat un nou sens al cuvântului comoditate, iar stocarea în cloud a introdus un alt nivel de păstrare a datelor în masă.

Prin AI, domenii precum învățarea automată și învățarea profundă deschid ochii către o lume cu toate posibilitățile. Învățarea automată este utilizată din ce în ce mai mult în analiza datelor pentru a da sens datelor mari. De asemenea, este folosit pentru a programa chatbots pentru a simula conversații umane cu clienții. Cu toate acestea, aceste aplicații directe de învățare automată nu ar fi posibile fără improvizația de procesare a limbajului natural (NLP).

Cum funcționează de fapt NLP?

NLP combină AI cu lingvistica computațională și informatică pentru a procesa limbaje și vorbire umane sau naturale. Procesul poate fi împărțit în trei părți. Prima sarcină a NLP este de a înțelege limbajul natural primit de computer. Computerul folosește un model statistic încorporat pentru a efectua o rutină de recunoaștere a vorbirii care convertește limbajul natural într-un limbaj de programare. Face acest lucru descompunând un discurs recent pe care îl aude în unități mici, apoi compară aceste unități cu unitățile anterioare dintr-un discurs anterior. Rezultatul sau rezultatul în format text determină statistic cuvintele și propozițiile care au fost cel mai probabil spuse. Această primă sarcină se numește procesul vorbire-text.

Următoarea sarcină este denumită etichetare parte-de-vorbire (POS) sau dezambiguizare a categoriei de cuvinte. Acest proces identifică elementar cuvintele din formele lor gramaticale ca substantive, verbe, adjective, timp trecut etc. folosind un set de reguli de lexic codate în computer. După aceste două procese, computerul probabil înțelege acum semnificația discursului care a fost rostit.

Al treilea pas făcut de un NLP este conversia text-vorbire. În această etapă, limbajul de programare al computerului este convertit într-un format sonor sau textual pentru utilizator. Un chatbot de știri financiare, de exemplu, căruia i se pune o întrebare de genul „Cum merge Google astăzi?” cel mai probabil va scana site-urile de finanțare online pentru stocul Google și poate decide să selecteze doar informații precum prețul și volumul ca răspuns.

NLP încearcă să facă computerele inteligente făcându-i pe oameni să creadă că interacționează cu un alt om. Testul Turing, propus de Alan Turing în 1950, afirmă că un computer poate fi pe deplin inteligent dacă poate gândi și face o conversație ca un om fără ca omul să știe că conversează de fapt cu o mașină. Un computer din 2014 a trecut testul în mod convingător – un chatbot cu personajul unui băiat de 13 ani. Acest lucru nu înseamnă că o mașină inteligentă este imposibil de construit, dar conturează dificultățile inerente în a face un computer să gândească sau să converseze ca un om. Întrucât cuvintele pot fi folosite în contexte diferite, iar mașinile nu au experiența reală pe care o au oamenii pentru a transmite și descrie entități în cuvinte, poate dura puțin mai mult până când lumea nu poate elimina complet limbajul de programare al computerului.