La differenza tra falsi negativi e falsi positivi
Per valutare l'efficacia di un modello previsionale si usano spesso termini come falso negativo, falso positivo, vero negativo e vero positivo.
Esempio. Nel machine learning un classificatore binario deve decidere se una email in arrivo è spam (positivo) oppure no (negativo).
- Vero positivo (true positive)
Sono le previsioni positive corrette. Si tratta di un'affermazione che viene confermata dalla realtà. Ad esempio, l'email viene classificata spam (positive) ed è effettivamente spam (true). La previsione è corretta. - Vero negativo (true negative)
Sono le previsioni negative corrette. Si tratta di una negazione che viene confermata dalla realtà. Ad esempio, l'email viene classificata no-spam (negative) ed è effettivamente non è spam (true). La previsione è corretta. - Falso positivo (false positive)
Sono le previsioni positive sbagliate. Si tratta di un'affermazione che non viene confermata dalla realtà. Ad esempio, l'email viene classificata spam (positive) ma non è spam (false). Il modello previsionale compie un errore classificabile tra i falsi positivi. - Falso negativo (false negative)
Sono le previsioni negative sbagliate. Si tratta di una negazione che non è confermata dalla realtà. Ad esempio, l'email viene classificata no-spam (negative) ma è spam (false). Il modello previsionale compie un altro errore classificabile tra i falsi negativi.
Nota. In questo esempio ho usato un semplice classificatore binario che si limita a classificare un oggetto tra due classi (SI o NO). E' il principio base su cui si basano molti modelli diagnostici e i software antispam e antivirus. Il concetto può comunque essere esteso anche ai classificatori multiclasse tramite la matrice di confusione (confusion matrix).
E così via.