Quali linguaggi di programmazione si usano nel machine learning

I linguaggi di programmazione più usati nel machine learning sono il linguaggio Python e il linguaggio R.

  • Python. E' un linguaggio di programmazione open source di alto livello, orientato agli oggetti. E' distribuito con licenza open source e si può usare sui sistemi operativi Windows, Linux, MacOS. Inoltre, dispone di molte librerie specifiche per il machine learning e per il calcolo matematico-vettoriale ( es. pandas, numpy, scipy, matplotlib ).
  • Linguaggio R. E' un linguaggio di programmazione progettato per l'analisi statistica. Si tratta di un software libero con licenza GNU GPL. E' disponibile per i sistemi operativi Windows, Linux e MacOS.

Nota. Negli ultimi anni si sta diffondendo più il linguaggio Python nel settore del machine learning e della data science in generale. Viceversa, il linguaggio R è sempre meno usato.

Oltre alla scelta del linguaggio di programmazione, è molto utile usare un framework specifico per il ML.

Quali framework usare del machine learning

Nel machine learning è molto utile affiancare il linguaggio di programmazione con dei framework specifici per il ML.

A cosa servono i framework? I framework includono librerie con funzioni dedicate per l'apprendimento automatico che semplificano, o perlomeno agevolano, il lavoro del data scientist.

Quali sono i framework più usati?

Eccone alcuni

  • TensorFlow
    E' una piattaforma open source. Una delle più conosciute e usate.
  • Scikit-learn
    E' una libreria open source con molte funzioni e algoritmi utili per il machine learning. Si utilizza con il linguaggio Python.
  • Pytorch
    E' un framework di deep learning. Sta riscuotendo una discreta diffusione.
  • Keras
    E' un'altra libreria open-source con funzioni dedicate al machine learning.
  • H20
    E' una piattaforma open source. E' usata sia con R che con Python.

Le librerie nei framework possono essere richiamate direttamente dal linguaggio di programmazione.

In alternativa, per semplificare il tutto, si può usare un ambiente di lavoro.

Quali ambienti di lavoro

Gli ambienti di lavoro rendono ulteriormente più semplice il lavoro del data scientist.

Cos'è un ambiente di lavoro? E' un'applicazione in grado di interfacciarsi con i linguaggi di programmazione, i framework e vari tool utili per la rappresentazione dei dati.

Uno degli ambienti di lavoro che apprezzo di più è Jupiter Lab.

Jupiter lab esempio

E' un ambiente di lavoro open-source.

Si può usare sia con Python che con R e molti altri linguaggi di programmazione.

Una piattaforma utile che semplifica il lavoro del data scientist è Anaconda.

la schermata iniziale di Anaconda

Anaconda è una distribuzione gratuita e open source dei linguaggi Python e R che semplifica notevolmente la gestione dei pacchetti e delle librerie tramite un'unica interfaccia grafica.

Al suo interno integra anche Jupiter Lab e molto altro ancora ( es. VS Code, RStudio, Jupiter Notebook, Spyder, Glueviz, ecc ).

Si può usare su Windows, Linux e MacOS.

E così via.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento

Machine Learning (ML)