I modelli decisionali dell'intelligenza artificiale

Le decisioni di un agente razionale può prendere le decisioni usando un modello logico oppure un modello basato sulla teoria delle decisioni.

Il modello decisionale logico
Il modello basato sulla teoria delle decisioni
L'efficienza del processo decisionale

Il modello decisionale logico

In un modello logico l'agente razionale decide le azioni per raggiungere un obiettivo finale.

Lo stato di un'azione viene misurato con una variabile booleana a due valori:

Vero. L'azione genera un risultato positivo per il raggiungimento dell'obiettivo.
Falso. L'azione non genera un risultato positivo per il raggiungimento dell'obiettivo.

Il modello logico è sicuramente il più semplice.

Tuttavia, in caso di incertezza o di conflitti tra obiettivi differenti, l'agente si blocca perché non riesce a prendere una decisione.

Esempio. L'agente ha due obiettivi O₁ e O₂ e può scegliere tra tre azioni (A, B). Ogni azione migliora un obiettivo ma peggiora l'altro. In questi casi l'agente logico non prende nessuna decisione. Si blocca.
un esempio di decisione conflittuale in un agente razionale logico

Il modello basato sulla teoria delle decisioni

In un modello basato sulla teoria delle decisioni, l'agente razionale prende le decisioni per massimizzare una funzione di utilità attesa considerando le probabilità di successo di ogni azione ( stato del mondo ).

l'agente razionale sceglie un'azione tra tante

Nella funzione di utilità attesa ( EU = Expected Utility ) sono considerati tutti gli obiettivi dell'agente razionale.

Esempio. L'agente razionale ha due obiettivi O₁ e O₂. Le decisioni A, B, C hanno un impatto diverso sui due obiettivi. La somma delle utilità positive e negative determina l'utilità attesa della decisione. L'agente razionale sceglie la decisione che massimizza l'utilità attesa. In questo caso l'agente opta per la decisione C.
la scelta dell'agente in base all'utilità attesa
Anche in questo caso ci sono delle decisioni conflittuali ma l'agente non si blocca. Prende comunque una decisione e non necessariamente è quella che elimina tutti i conflitti (decisione A).

In questi modelli, l'agente riesce comunque a prendere una decisione anche in situazioni complesse di incertezza o di conflitto tra obiettivi.

Il modello decisionale si complica prendendo in considerazione l'incertezza e le azioni non deterministiche.

Nota. Le azioni sono non deterministiche quando non c'è una relazione di causa-effetto certa al 100%. Una particolare azione può produrre un effetto oppure un altro.

In questo caso bisogna costruire un modello decisionale probabilistico.

Come funziona un modello decisionale deterministico?

Le principali caratteristiche del modello decisionale probabilistico sono le seguenti

Ogni azione non deterministica ( A, B, C ) può determinare diversi risultati R_i.
Ogni risultato R_i ha una diversa probabilità di verificarsi P(R_i).
Ogni risultato R_i ha un impatto diverso sull'utilità attesa EU(R_i).

un esempio di modello decisionale probabilistico

Esempio. Nel seguente esempio l'agente razionale prende in considerazione le probabilità dei risultati ottenuti di ogni scelta e l'impatto sulla funzione di utilità EU. La decisione B è la migliore perché massimizza l'utilità attesa.
un esempio di modello decisionale
La decisione C non è più la migliore possibile perché nel 20% dei casi ( p=0.2 ) può causare danni enormi alla funzione di utilità ( -2.6 del risultato 2 ). Nel prendere la sua decisione l'agente ne tiene conto. Per questa ragione ora la decisione B è la migliore.

Nota. Il principio della massima utilità attesa (MEU) è soltanto un criterio tra tanti adottabili. Ad esempio, si potrebbe usare un criterio di scelta alternativo che riduce i rischi ( valori negativi ) o stabilire delle preferenze ordinali tra gli obiettivi ( es. O₁ > O₂), ecc.

I limiti del modello decisionale probabilistico

Tuttavia, non è semplice costruire un modello probabilistico per diverse motivi:

Informazione imperfetta. Spesso l'agente razionale non conosce tutte le variabili del problema, né sa con precisione le probabilità P dei risultati R_i di ogni azione.
Nota. In pratica, l'agente razionale non ha un modello causale completo della realtà che lo circonda. E' inevitabile, non solo per la complessità dei fenomeni naturali/sociali ma anche perché qualsiasi informazione aggiuntiva ha comunque un costo in termini di risorse e di tempo. Se il valore dell'informazione è inferiore al costo, è razionale rinunciarvi.

Questa funzione è solitamente affidata ad appositi algoritmi di raccolta delle informazioni basati sul criterio dell'analisi costi-benefici.
Complessità temporale e spaziale. I calcoli potrebbero richiedere troppo tempo ( complessità temporale ) o una quantità di memoria troppo grande ( complessità spaziale ).

Nota. Alcuni problemi non possono essere affrontati con la logica computazionale classica. Sono detti NP-difficili. In questi casi bisogna cercare altre logiche ( es. algoritmi approssimati, euristici, ecc. ).

L'efficienza del processo decisionale

Il modello decisionale deve anche prendere in considerazione l'efficienza, non solo l'utilità ( efficacia ) e il rischio.

Esempio. L'agente potrebbe non avere il tempo o le risorse per raccogliere tutte le informazioni e prendere la decisione migliore possibile. A volte è preferibile optare per una decisione accettabile o correre qualche rischio.

Per considerare questi aspetti si utilizza il processo decisionale di Markov ( o modello MDP ).

un esempio di modello decisionale basato sul processo di Markov

Markov associa a ogni decisione un costo ( o ricompensa negativa ) e un premio al raggiungimento dell'obiettivo ( ricompensa positiva ).

In questo modo, l'agente razionale è spinto a considerare anche l'efficienza delle scelte.

FAQ

Cos'è il processo decisionale markoviano?
Il processo di decisione di markov ( modello MDP ) è un modello decisionale che associa a ogni decisione delle ricompense negative o positive.