Come installare NLTK su Python

NLTK è una libreria del linguaggio di programmazione python specifica per elaborare il linguaggio naturale.

Cosa significa NLTK? La parola NLTK significa Natural Language Tool Kit. E' usata nelle applicazioni di natural language processing ( NLP ) e data scientist.

Dove scaricare NLTK

La libreria NLTK è pre-installata negli ambienti operativi (environment) di Anaconda.

Cos'è Anaconda? E' un ambiente operativo di python con diverse librerie scientifiche. Tra queste c'è anche la libreria NLTK. Anaconda è installabile gratuitamente sui sistemi operativi Windows, Linux e Mac ( es. come installare Anaconda su Linux ).

La libreria NLTK può essere usata anche senza Anaconda, scaricando le librerie direttamente dal sito www.nltk.org o installandole su altre architetture interattive come iPython o Jupiter.

Tuttavia, il processo di installazione è più lungo ( esempio di installazione manuale ).

Per questa ragione consiglio di iniziare a usare NLTK su Anaconda.

E' più facile e include molte altre librerie scientifiche utili per i data scientist.

Nota. Una volta imparato a lavorare con le librerie di NLTK con Anaconda si può sempre cambiare sistema, a seconda delle esigenze di personalizzazione del software.

Come verificare se NLTK è già installato su Anaconda

Per verificare se la libreria NLTK è già installata, apro Anaconda e seleziono Environments.

Si trova sul menu laterale a sinistra.

come verificare se NLTK è installata su Anaconda

Poi scorro la lista in basso fino alla N.

Tra le altre cose dovrebbe esserci anche la voce nltk.

A questo punto posso importare le librerie in memoria.

Come avviare NLTK

Entro sulla console interattiva di python.

Sulla riga di comando di python digito import nltk e do invio

digitare import nltk

Poi scarico le librerie digitando nltk.download('all')

digitare nltk.download('all')

Lo scaricamento dei dati dura qualche decina di minuti.

Alla fine un messaggio sulla riga di comando di Python conferma l'installazione.

l'installazione di NLKT su Python

Ho installato le librerie di NLKT su python

Posso cominciare a usarle per processare il linguaggio naturale tramite il linguaggio di programmazione python.

Un esempio pratico

Per provare se tutto funziona correttamente digito sulla console di Python i seguenti comandi:

un esempio di utilizzo delle librerie NLTK

La funzione nltk.pos_tag() analizza se una parola è un nome (NN), un articolo ( DT) o un verbo (VBZ).

Poi assegna alle parole del testo il relativo tag POS ( Part of Speech ) .

A cosa servono i tag POS? I tag POS sono le sigle DT, NN, VBZ. Sono abitualmente usati nel Natural Language Processing per identificare le parti grammaticali del discorso in una frase o in un corpus di testo. Sono il primo passo per consentire al programma di risalire al significato della frase.

Trasformo i token in entità ( entities ) del discorso logico tramite un'altra funzione della libreria nltk.

Si tratta di nltk.chunk.ne_chunk().

la trasformazione dei token in entità della frase

Infine, visualizzo graficamente l'albero sintattico ( syntax tree ) della frase con l'istruzione draw().

l'albero sintattico ( syntax Tree )

Tutto funziona correttamente.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Natural Language Toolkit

FAQ / Esempi