La tecnica del clustering

Il clustering è una tecnica di apprendimento senza supervisione che esplora i dati alla ricerca di possibili relazioni e raggruppamenti detti "cluster".

Cos'è un cluster? E' un insieme o gruppo di oggetti che hanno alcune caratteristiche simili ma non tutte. Non sono necessariamente identici. Il cluster ha lo stesso significato sia nel machine learning che in altre discipline scientifiche, come la statistica o il marketing.

Nel machine learning il clustering è anche detto classificazione senza supervisione.

    Un esempio pratico

    In questi dati sono presenti tre caratteristiche x1, x2, x3.

    un esempio pratico

    La macchina non ha informazioni sulle etichette e nessuna funzione di apprendimento. Non c'è supervisione.

    Ciò nonostante, nella tabella c'è una relazione significativa tra x1, x2, x3.

    Per vederla meglio, escludo momentaneamente il dato x3 e rappresento i dati x1, x2 su un diagramma cartesiano.

    Nel grafico a due dimensioni comincia già a vedersi una regolarità e uno schema nei dati.

    la rappresentazione grafica a due dimensioni

    Poi associo un colore diverso ( blu, rosso ) alle coordinate (x1, x2) per indicare il terzo dato x3 ossia la terza dimensione.

    Il blu per il valore x3=1 e il rosso per il valore x3=2.

    il clustering a tre dimensioni

    Ora il raggruppamento (cluster) è subito evidente anche a occhio nudo.

    Nel cluster A e nel cluster B sono raggruppati dei dati simili.

    In questo modo la macchina ha appreso un'informazione rilevante dai dati, senza alcun aiuto da parte del supervisore.

    Nota. Questo è un semplice esempio a due dimensioni ma rende l'idea del funzionamento. In realtà, il clustering è particolarmente utile quando è applicato a banche dati multidimensionali. Dove l'occhio umano non può fare nulla.

    Nel machine learning gli algoritmi di clustering sono usati per individuare le relazione tra i dati tramite un processo matematico-statistico di apprendimenti.

     


     

    Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

    FacebookTwitterLinkedinLinkedin
    knowledge base

    Libri di approfondimento

    Machine Learning (ML)