Le reti di decisione

Le reti di decisioni ( o diagrammi di influenza ) sono strumenti per rappresentare graficamente un problema decisionale tramite nodi e archi. Sono simili alle reti bayesiane ma utilizzano diverse tipologie di nodi.

un esempio di rete di decisioni

Nella rete di decisioni sono rappresentate:

le informazioni disponibili sul problema
lo stato corrente dell'agente
lo stato corrente dell'ambiente
le decisioni/azioni possibili
i nessi causa/effetto probabilistici
i possibili stati dopo le azioni
l'utilità degli stati dopo le azioni

Come funziona una rete di decisione
Un esempio di rete decisionale
Le reti di decisioni dinamiche

Come funziona una rete di decisione

La rete utilizza diverse tipologie di nodi:

Nodi di possibilità. Hanno una forma ovale. Descrivono gli stati possibili dell'ambiente operativo. Se descrivono uno stato corrente sono variabili di prova. Viceversa, se descrivono uno stato futuro sono un rischio. I nodi di possibilità sono le variabili casuali del problema, quelle che l'agente razionale non conosce con certezza ( es. problemi legali, rischio di incidenti, costi di riparazione dovuti a guasti, ecc. ). Tutte queste variabili dipendono da nodi genitori, cause esterne ( altri nodi di possibilità) e/o decisioni dell'agente ( nodi di decisione ).

Nota. Ogni nodo genitore di possibilità potrebbe includere al suo interno una rete bayesiana ad hoc per determinare il suo stato corrente ( es. una rete bayesiana per stimare la percentuale del rischio di guasti ).
Nodi di decisione. Hanno una forma rettangolare. Sono le variabili di scelta decise dall'agente razionale. Le decisioni influenzano i nodi di possibilità della rete decisionale. A ogni nodi di decisione è associato un elenco di possibili valori, un valore per ogni decisione possibile.

Nota. Una volta presa la decisione, il nodo si trasforma in un nodo di possibilità perché l'informazione assume un valore certo come una qualsiasi variabile di prova.
Nodi di utilità ( o nodi di valore ). Hanno la forma di un rombo. Questi nodi hanno la funzione di quantificare il valore dell'utilità ottenuta a seguito delle scelte dell'agente. L'utilità viene calcolata con un algoritmo inferenziale che considera tutte le possibili decisioni dell'agente e i probabili effetti/conseguenze sullo stato dell'ambiente operativo. Al termine dell'elaborazione, l'agente sceglie l'azione che massimizza la funzione di utilità attesa secondo il principio MEU ( Max Expected Utility ).
Nota. Il principio MEU è soltanto uno dei tanti criteri adottabili. Ad esempio, l'algoritmo potrebbe essere impostato per ridurre i rischi anziché massimizzare l'utilità attesa. La logica e il funzionamento della rete decisionale non cambia. Alla fine il nodo di utilità seleziona comunque la decisione che ritiene "migliore"

Un esempio di rete decisionale

La seguente rete di decisioni è composta da un nodo decisionale, due variabili di prova, due nodi di possibilità sugli stati futuri e un nodo di utilità.

un esempio di rete di decisioni

Nota. Le variabili di prova indicano lo stato corrente dell'ambiente operativo e influenzano sia le decisioni dell'agente che i possibili stati futuri.

Le reti di decisioni dinamiche

Una tipologia particolare di rete decisionale è la dynamic decision network ( DDN ) o rete decisionale dinamica.

In una rete decisionale dinamica l'agente esplora le possibili sequenze di decisioni in avanti, scegliendo quella che massimizza l'utilità attesa.

Si tratta di un modello decisionale nato per risolvere problemi in contesti di incertezza.