Come funziona il linguaggio
Un linguaggio è un insieme composto da un numero infinito di stringhe di simboli ( frasi ).
Una stringa è una sequenza di simboli terminali ( parole ) che costruiscono il significato della frase.
Le stringhe sono costruite seguendo le regole della grammatica e veicolano un significato ( semantica ).
La grammatica del linguaggio
Il linguaggio è definito da un insieme di regole ( grammatica ).
Tuttavia, nel linguaggio naturale non sempre sono seguite e non c'è un'unica interpretazione dei linguisti sulla grammatica di una lingua.
Inoltre, una frase potrebbe comunicare un messaggio e avere significato anche se è sgrammaticata o dialettale.
Nota. La lingua cambia nel corso del tempo. Ai linguisti spetta il compito di studiare le regole della lingua così come è, ma non c'è una visione comune e spesso una lingua ha più grammatiche leggermente diverse tra loro.
La semantica del linguaggio
Una stringa è sempre associata a un significato ( semantica ).
La comprensione del significato è spesso legata al contesto, al discorso o alla situazione ( pragmaticità ) in cui viene pronunciata.
Quindi, una stessa stringa può avere diversi significati.
La struttura sintagmatica
Ogni stringa (frase) è composta da sottostringhe detti sintagmi.
Esistono diverse tipologie di sintagmi
- NP = sintagma nominale ( Noun Phrase )
- VP = sintagma verbale ( Verb Phrase )
I simboli NP e VP sono detti simboli non terminali perché sono etichette associate alle parole.
Nota. Per riconoscere meglio i sintagmi è preferibile eseguire prima la segmentazione del testo. In questo modo le parole composte ( es. pannelli solari ) sono strattate come un unico simbolo terminale ( es. pannelli_solari ).
A cosa servono i sintagmi?
L'individuazione dei sintagmi in una frase consente di interpretarne il significato, perché i sintagmi sono elementi semantici forti in un enunciato.
La combinazione dei sintagmi NP + VP forma un sintagma frase ( S = sentence ).
La disposizione dei sintagmi in una stringa è regolata dalla grammatica della lingua.
Esempio. Nella lingua inglese il verbo precede sempre il nome nelle frasi interrogative ( VP+NP ), mentre lo segue nelle frasi affermative ( NP+VP ).
Spesso è utile assegnare delle etichette anche ai sintagmi minori come i numerali, gli aggettivi, gli avverbi, le proposizioni, gli articoli, le negazioni, ecc.
- ADJP = aggettivi ( Adjective Phrase )
- ADVP = avverbi ( Adverb Phrase )
- CONJ = congiunzioni
- DET = articoli
- END = punteggiatura
- NOT = negazione
- PREP = preposizioni
- PRON = pronomi
Ad esempio, considerando i sintagmi minori alla precedente stringa sono aggiunte nuove etichette:
L'analisi della stringa diventa più complessa ma è più efficace l'interpretazione del significato dell'enunciato.
Esempio. La presenza di una negazione "non" davanti al sintagma frase (S) ne inverte il significato. Ad esempio, la frase "voglio mangiare" e "non voglio mangiare" hanno lo stesso sintagma frase (S) ma un significato diametralmente opposto.
La differenza tra il linguaggio naturale e il linguaggio di programmazione
Un linguaggio di programmazione è formale e segue un numero finito di regole grammaticali, in genere poche.
La grammatica di un linguaggio formale è rigida e non sono ammesse violazioni alle regole.
Nota. Viceversa la grammatica del linguaggio naturale è più flessibile e ha molte più regole. Nel processo di comunicazione sono ammese anche le violazioni.
Inoltre, il linguaggio di programmazione ha una semantica ma non ha una pragmaticità, perché il significato delle stringhe è univoco e generale. Le stringhe sono legate anche al contesto.
Per queste ragioni, è difficile trattare il linguaggio naturale come un linguaggio formale.