Come installare NLTK su Windows, Linux e Mac
Si può installare manualmente la libreria NLTK ( Natural Language Toolkit ) di Python su Windows, Linux o Mac.
Windows
Metodo 1
Per installare la libreria NLTK di Python su Windows, vado sul sito ufficiale www.nltk.org
Poi clicco sulla voce Installing NLTK
Attenzione. Per installare NLTK deve essere già installato Python su Windows. Sul sito NLTK c'è il link per fare l'installazione della versione di Python compatibile con la libreria.
Scarico l'installer di NLTK per Windows.
Poi avvio l'installazione fino alla fine.
Alla fine dell'installazione la libreria NLTK dovrebbe essere stata aggiunta sy Python.
Se questa procedura non dovesse funzionare, utilizzo il metodo 2.
Metodo 2
Apro il prompt dei comandi DOS di Windows ed entro nella cartella Scripts di Python con il comando CD.
Dovrebbe trovarsi nella cartella AppData.
cd \users\nome_utente\appdata\local\programs\python\python36-32\Scripts
Il nome dell'utente e della versione python cambia a seconda dei casi.
Il contenuto della directory Scripts di Python è il seguente:
Sul prompt dei comandi digito easy_install pip
Poi digito pip nltk install sempre sul prompt dei comandi dos.
Per completezza installo anche NumPY, la libreria di calcolo scientifico di python.
E' facoltativa ma utile.
Sulla riga di comando digito pip install numpy.
A questo punto apro la console interattiva di Python.
Importo la libreria NLTK con il comando import nltk.
Se tutto va bene, il prompt della console va a capo senza errori.
A questo punto installo i dati delle librerie NLTK con il comando nltk.download('all')
Attenzione. E' necessario che ci sia il collegamento internet attivo.
L'installazione dei dati è un po' lunga, dura qualche decina di minuti.
Al termine dell'installazione NLTK è stato aggiunto su Python.
Posso già cominciare a lavorare con la libreria NLTK.
Un esempio pratico
Per vedere se tutto funziona correttamente provo a eseguire un semplice esempio.
La funzione nltk.pos_tag() ha assegnato alle parole il tag POS ( Part of Speech ) corrispondente.
Tutto funziona correttamente.
Spiegazione. La funzione nltk.pos_tag() ha riconosciuto che "The" è un articolo (DT), "Cat" e "Mouse" sono nomi (NN) e "hunts" è un verbo (VBZ). I tag POS sono DT, NN e VBZ. Sono dei tag standard usati nel Natural Language Processing.
Mac / Unix / Linux
Sui sistemi operativi Mac o Linux l'installazione di NLTK è molto semplice, basta digitare
sudo pip install -U nltk
Una volta installata, posso importare la libreria dentro il codice python con l'istruzione
import nltk
E così via.