I modelli decisionali dell'intelligenza artificiale
Le decisioni di un agente razionale può prendere le decisioni usando un modello logico oppure un modello basato sulla teoria delle decisioni.
Il modello decisionale logico
In un modello logico l'agente razionale decide le azioni per raggiungere un obiettivo finale.
Lo stato di un'azione viene misurato con una variabile booleana a due valori:
- Vero. L'azione genera un risultato positivo per il raggiungimento dell'obiettivo.
- Falso. L'azione non genera un risultato positivo per il raggiungimento dell'obiettivo.
Il modello logico è sicuramente il più semplice.
Tuttavia, in caso di incertezza o di conflitti tra obiettivi differenti, l'agente si blocca perché non riesce a prendere una decisione.
Esempio. L'agente ha due obiettivi O1 e O2 e può scegliere tra tre azioni (A, B). Ogni azione migliora un obiettivo ma peggiora l'altro. In questi casi l'agente logico non prende nessuna decisione. Si blocca.
Il modello basato sulla teoria delle decisioni
In un modello basato sulla teoria delle decisioni, l'agente razionale prende le decisioni per massimizzare una funzione di utilità attesa considerando le probabilità di successo di ogni azione ( stato del mondo ).
Nella funzione di utilità attesa ( EU = Expected Utility ) sono considerati tutti gli obiettivi dell'agente razionale.
Esempio. L'agente razionale ha due obiettivi O1 e O2. Le decisioni A, B, C hanno un impatto diverso sui due obiettivi. La somma delle utilità positive e negative determina l'utilità attesa della decisione. L'agente razionale sceglie la decisione che massimizza l'utilità attesa. In questo caso l'agente opta per la decisione C.
Anche in questo caso ci sono delle decisioni conflittuali ma l'agente non si blocca. Prende comunque una decisione e non necessariamente è quella che elimina tutti i conflitti (decisione A).
In questi modelli, l'agente riesce comunque a prendere una decisione anche in situazioni complesse di incertezza o di conflitto tra obiettivi.
Il modello decisionale si complica prendendo in considerazione l'incertezza e le azioni non deterministiche.
Nota. Le azioni sono non deterministiche quando non c'è una relazione di causa-effetto certa al 100%. Una particolare azione può produrre un effetto oppure un altro.
In questo caso bisogna costruire un modello decisionale probabilistico.
Come funziona un modello decisionale deterministico?
Le principali caratteristiche del modello decisionale probabilistico sono le seguenti
- Ogni azione non deterministica ( A, B, C ) può determinare diversi risultati Ri.
- Ogni risultato Ri ha una diversa probabilità di verificarsi P(Ri).
- Ogni risultato Ri ha un impatto diverso sull'utilità attesa EU(Ri).
Esempio. Nel seguente esempio l'agente razionale prende in considerazione le probabilità dei risultati ottenuti di ogni scelta e l'impatto sulla funzione di utilità EU. La decisione B è la migliore perché massimizza l'utilità attesa.
La decisione C non è più la migliore possibile perché nel 20% dei casi ( p=0.2 ) può causare danni enormi alla funzione di utilità ( -2.6 del risultato 2 ). Nel prendere la sua decisione l'agente ne tiene conto. Per questa ragione ora la decisione B è la migliore.
Nota. Il principio della massima utilità attesa (MEU) è soltanto un criterio tra tanti adottabili. Ad esempio, si potrebbe usare un criterio di scelta alternativo che riduce i rischi ( valori negativi ) o stabilire delle preferenze ordinali tra gli obiettivi ( es. O1 > O2 ), ecc.
I limiti del modello decisionale probabilistico
Tuttavia, non è semplice costruire un modello probabilistico per diverse motivi:
- Informazione imperfetta. Spesso l'agente razionale non conosce tutte le variabili del problema, né sa con precisione le probabilità P dei risultati Ri di ogni azione.
Nota. In pratica, l'agente razionale non ha un modello causale completo della realtà che lo circonda. E' inevitabile, non solo per la complessità dei fenomeni naturali/sociali ma anche perché qualsiasi informazione aggiuntiva ha comunque un costo in termini di risorse e di tempo. Se il valore dell'informazione è inferiore al costo, è razionale rinunciarvi.
Questa funzione è solitamente affidata ad appositi algoritmi di raccolta delle informazioni basati sul criterio dell'analisi costi-benefici. - Complessità temporale e spaziale. I calcoli potrebbero richiedere troppo tempo ( complessità temporale ) o una quantità di memoria troppo grande ( complessità spaziale ).
Nota. Alcuni problemi non possono essere affrontati con la logica computazionale classica. Sono detti NP-difficili. In questi casi bisogna cercare altre logiche ( es. algoritmi approssimati, euristici, ecc. ).
L'efficienza del processo decisionale
Il modello decisionale deve anche prendere in considerazione l'efficienza, non solo l'utilità ( efficacia ) e il rischio.
Esempio. L'agente potrebbe non avere il tempo o le risorse per raccogliere tutte le informazioni e prendere la decisione migliore possibile. A volte è preferibile optare per una decisione accettabile o correre qualche rischio.
Per considerare questi aspetti si utilizza il processo decisionale di Markov ( o modello MDP ).
Markov associa a ogni decisione un costo ( o ricompensa negativa ) e un premio al raggiungimento dell'obiettivo ( ricompensa positiva ).
In questo modo, l'agente razionale è spinto a considerare anche l'efficienza delle scelte.
FAQ
- Cos'è il processo decisionale markoviano?
Il processo di decisione di markov ( modello MDP ) è un modello decisionale che associa a ogni decisione delle ricompense negative o positive.