La classificazione nel machine learning

In un problema di classificazione (classification) l'algoritmo assegna una classe (etichetta) a ogni esempio del dataset. L'algoritmo di classificazione è detto classificatore. E' un problema tipico nel machine learning.

La classe è un'etichetta tra un insieme finito di classi.

  • Classificazione binaria (o classificazione binomiale) se le etichette sono soltanto due.
  • Classificazione multiclasse (multiclass classification) se le classi sono tre o più.

Esempio. Un esempio pratico di classificazione binaria sono i filtri anti-spam che associano a ogni email in entrata una etichetta "spam" o "no-spam".

un esempio di classificazione

In genere l'etichetta di un numero scalare ( es. 0/1 ). Tuttavia, in alcuni algoritmi sono accettate anche le stringhe.

Come costruire il modello di classificazione

L'assegnazione automatica dell'etichetta si basa su un modello statistico ottenuto con un algoritmo di apprendimento supervisionato che analizza una raccolta di esempi in input già etichettati.

In questo caso si parla di classificazione supervisionata.

un esempio pratico di machine learning

Il modello statistico può comunque essere comunque costruito anche con algoritmi di apprendimento non supervisionato.

Ad esempio, il clustering permette di costruire un modello di apprendimento per somiglianza e distanza.

Un esempio pratico

Un algoritmo di classificazione binomiale divide lo spazio dei dati del dataset in due classi (etichette).

la classificazione nel machine learning

Nota. Nella figura precedente i punti blu e verdi sono gli esempi ripartiti in due classi. La retta rossa separa le due classi. Si tratta di una semplice classificazione binomiale lineare.

L'algoritmo di classificazione può essere lineare oppure non lineare.

  • Classificazione lineare
    Negli algoritmi di classificazione lineari il confine di separazione dei dati è una retta un piano o un iperpiano.
  • Classificazione non lineare
    Negli algoritmi di classificazione non lineari, invece, il confine di separazione è una curva.

E così via.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento

Machine Learning (ML)