L'apprendimento con rinforzo

L'apprendimento con rinforzo ( reinforcement learning o RL ) è una tecnica di machine learning in cui l'agente apprende la conoscenza tramite una funzione di rinforzo. E' anche detto apprendimento di rafforzamento o per rinforzo.

Come funziona il reinforcement learning

L'agente prende le decisioni e valuta i feed-back dell'ambiente con una funzione di rinforzo.

Cos'è la funzione di rinforzo

La funzione di rinforzo ( o funzione di rafforzamento ) misura il grado di successo di un'azione o decisione, rispetto a un obiettivo predeterminato.

Se il feed-back è positivo, la funzione di rinforzo assegna un premio ( ricompensa ) alla macchina.

il machine learning con rinforzo

Lo scopo dell'agente è la massimizzazione della funzione di rinforzo.

Nel RF l'agente tende a ripetere le azioni più profittevoli, quelle con la ricompensa più alta, evitando le azioni in perdita.

Pro e contro del reinforcement learning

Il reinforcement learning (RF) unisce i vantaggi dell'apprendimento supervisionato e non supervisionato.

  • Apprendimento non supervisionato. Come nell'apprendimento non supervisionato, nel RF la macchina non è legata a una tabella di esempi con input e output scritti da un progettista. Quindi, è meno legata al contenuto del training set e può prendere le decisioni con meno vincoli e un maggiore grado di libertà. Tuttavia, a differenza dell'apprendimento non supervisionato, l'agente non inizia il processo di apprendimento senza conoscenza pregressa. Nel reinforcement learning la macchina può distinguere fin da subito le azioni positive e negative tramite una funzione di rinforzo.
  • Apprendimento supervisionato. Come nell'apprendimento supervisionato, nel RF l'agente è aiutato nel processo di apprendimento. Tuttavia, i feedback non sono etichette aggiunte da un supervisore negli esempi dell'insieme di training ma una funzione matematica di rafforzamento. Pertanto, a differenza dell'apprendimento supervisionato, nel RF la macchina è in grado di valutare anche situazioni non previste inizialmente dal progettista.



Per scrivere un commento

knowledge base

Machine Learning (ML)