La conoscenza pregressa (background)
Nel machine learning la conoscenza pregressa è il background acquisito dall'agente razionale durante l'apprendimento e le osservazioni.
Un apprendimento basato sulla conoscenza pregressa elabora le nuove osservazioni considerando anche le precedenti osservazioni.
Ogni nuova osservazione consente all'agente di costruire o modificare la rappresentazione della realtà che lo circonda.
D'altra parte, le nuove osservazioni sono elaborate anche in base a ciò che l'agente già conosce.
E quello che normalmente chiamiamo esperienza.
La differenza tra conoscenza pregressa e a priori
I due concetti sono simili ma non sono la stessa cosa.
- La conoscenza a priori ( o conoscenza iniziale ) è il background di base della macchina per evitare l'apprendimento partendo da zero. Sono regole e informazioni programmate dal progettista.
- La conoscenza indotta è il background accumulato dalla macchina durante le osservazioni e il processo di apprendimento ( learning process ).
Pertanto, sia la conoscenza pregressa a priori che indotta influiscono sull'apprendimento e sulla valutazione delle nuove osservazioni.
Tuttavia, hanno cause e origini diverse.
Nota. In molti libri di testo la conoscenza a priori e indotta sono considerate la stessa cosa. Personalmente, preferisco non seguire questa strada. A mio giudizio è preferibile distinguerle perché agiscono su processi distinti dell'apprendimento. Ad esempio, un errore nella KB iniziale è perlopiù un errore umano del progettista. Viceversa, un errore nella KB indotta è un errore della macchina e del processo di apprendimento.
A cosa serve la conoscenza pregressa nel machine learning
La conoscenza pregressa migliora l'apprendimento induttivo basato sull'osservazione.
Il primo a mettere in dubbio l'induzione fu Nelson Goodman nel 1954.
Non basta osservare un evento molte volte per poter indurre un'ipotesi accettabile.
Un esempio pratico
Osservando uno smeraldo da un'angolazione α di luce ha un riflesso di colore verde.
Da un'altra angolazione β, invece, lo stesso smeraldo ha un riflesso di colore blu.
Questo fenomeno fisico accade a causa della rifrazione della luce.
Se la macchina osservasse un miliardo di smeraldi sempre dalla stessa angolazione α, potrebbe indurre che siano tutti di colore verde. Ma così non è.
E' un esempio classico di inferenza errata.
E a cosa serve la conoscenza pregressa?
La conoscenza pregressa costringe la macchina a osservare un oggetto da più angolazioni.
In questo modo la macchina può accorgersi che l'angolazione influisce sul colore dello smeraldo.
Si riduce così il rischio di cadere in inferenze errate.
E così via.
Nota. Questo esempio è una personalizzazione del paradosso degli smeraldi verblu di Nelson Goodman, usato negli studi sulla logica per spiegare i limiti del processo induttivo.