Come caricare un dataset su Jupyter Lab

Per caricare un dataset all'interno di Jupyter Lab clicco sull'icona dell'upload nel menù in alto.

come caricare un dataset in memoria su Jupyter Lab

Poi seleziono il file sul mio PC che voglio caricare nell'ambiente di lavoro di Jupyter Lab.

Nota. In questo caso ho caricato un file csv scaricato dal sito UCI Machine Learning Repository

Nella prima cella di JupyterLab importo la libreria pandas nell'intrepete python.

Nella seconda cella carico il contenuto del file csv nella variabile df tramite il metodo read_csv().

carico la libreria pandas e il dataset in memoria

Ora i dati si trovano nella variabile df.

Per vedere alcuni record a caso uso il metodo sample()

Tra le parentesi indico il numero dei record da visualizzare. In questo caso sono cinque.

alcuni dati del dataset

Nota. In alternativa, per vedere i primi record del dataset uso il metodo head() mentre per vedere gli ultimi il metodo tail().

Per visualizzare alcuni dati statistici del dataset uso il metodo describe().

come vedere le statistiche

Per vedere i nomi delle colonne (campi) del dataset uso il metodo columns.

come visualizzare i nomi dei campi del dataset

Per fare un grafico con i dati del dataset carico in memoria i moduli seaborn e matplotlib di python.

Una volta caricate utilizzo la funzione barplot() per creare il grafico.

come visualizzare un grafico con Jupyter Lab

E così via.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Anaconda (data science)

Jupyter Lab

Jupiter Notebook