Come funziona il linguaggio

Un linguaggio è un insieme composto da un numero infinito di stringhe di simboli ( frasi ).

un esempio di stringhe in un documento ( corpus )

Una stringa è una sequenza di simboli terminali ( parole ) che costruiscono il significato della frase.

la frase è una stringa composta da simboli

Le stringhe sono costruite seguendo le regole della grammatica e veicolano un significato ( semantica ).

La grammatica del linguaggio

Il linguaggio è definito da un insieme di regole ( grammatica ).

la struttura del linguaggio

Tuttavia, nel linguaggio naturale non sempre sono seguite e non c'è un'unica interpretazione dei linguisti sulla grammatica di una lingua.

Inoltre, una frase potrebbe comunicare un messaggio e avere significato anche se è sgrammaticata o dialettale.

Nota. La lingua cambia nel corso del tempo. Ai linguisti spetta il compito di studiare le regole della lingua così come è, ma non c'è una visione comune e spesso una lingua ha più grammatiche leggermente diverse tra loro.

La semantica del linguaggio

Una stringa è sempre associata a un significato ( semantica ).

il contesto determina il significato della stringa

La comprensione del significato è spesso legata al contesto, al discorso o alla situazione ( pragmaticità ) in cui viene pronunciata.

Quindi, una stessa stringa può avere diversi significati.

La struttura sintagmatica

Ogni stringa (frase) è composta da sottostringhe detti sintagmi.

Esistono diverse tipologie di sintagmi

  • NP = sintagma nominale ( Noun Phrase )
  • VP = sintagma verbale ( Verb Phrase )

I simboli NP e VP sono detti simboli non terminali perché sono etichette associate alle parole.

un esempio di struttura sintagmatica

Nota. Per riconoscere meglio i sintagmi è preferibile eseguire prima la segmentazione del testo. In questo modo le parole composte ( es. pannelli solari ) sono strattate come un unico simbolo terminale ( es. pannelli_solari ).

A cosa servono i sintagmi?

L'individuazione dei sintagmi in una frase consente di interpretarne il significato, perché i sintagmi sono elementi semantici forti in un enunciato.

i sintagmi sono elementi semantici forti

La combinazione dei sintagmi NP + VP forma un sintagma frase ( S = sentence ).

esempio di struttura sintagmatica con disposizione vincolata alle regole grammaticali

La disposizione dei sintagmi in una stringa è regolata dalla grammatica della lingua.

Esempio. Nella lingua inglese il verbo precede sempre il nome nelle frasi interrogative ( VP+NP ), mentre lo segue nelle frasi affermative ( NP+VP ).
la struttura sintagmatica di una frase affermativa (S) e interrogativa (Q) nella lingua inglese

Spesso è utile assegnare delle etichette anche ai sintagmi minori come i numerali, gli aggettivi, gli avverbi, le proposizioni, gli articoli, le negazioni, ecc.

  • ADJP = aggettivi ( Adjective Phrase )
  • ADVP = avverbi ( Adverb Phrase )
  • CONJ = congiunzioni
  • DET = articoli
  • END = punteggiatura
  • NOT = negazione
  • PREP = preposizioni
  • PRON = pronomi

Ad esempio, considerando i sintagmi minori alla precedente stringa sono aggiunte nuove etichette:

l'analisi dei sintagmi minori

L'analisi della stringa diventa più complessa ma è più efficace l'interpretazione del significato dell'enunciato.

Esempio. La presenza di una negazione "non" davanti al sintagma frase (S) ne inverte il significato. Ad esempio, la frase "voglio mangiare" e "non voglio mangiare" hanno lo stesso sintagma frase (S) ma un significato diametralmente opposto.

La differenza tra il linguaggio naturale e il linguaggio di programmazione

Un linguaggio di programmazione è formale e segue un numero finito di regole grammaticali, in genere poche.

La grammatica di un linguaggio formale è rigida e non sono ammesse violazioni alle regole.

nel linguaggio formale le regole grammaticali sono rigide

Nota. Viceversa la grammatica del linguaggio naturale è più flessibile e ha molte più regole. Nel processo di comunicazione sono ammese anche le violazioni.

Inoltre, il linguaggio di programmazione ha una semantica ma non ha una pragmaticità, perché il significato delle stringhe è univoco e generale. Le stringhe sono legate anche al contesto.

Per queste ragioni, è difficile trattare il linguaggio naturale come un linguaggio formale.


 
Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento

Natural Language Processing

FAQ