ChatGPT O1
ChatGPT O1 utilizza la tecnica "Chain of Thought" (CoT), che richiede al modello di generare ragionamenti passo per passo. Questo approccio migliora la capacità di analisi e risoluzione dei problemi attraverso la descrizione esplicita di ogni passaggio nel ragionamento.
Come funziona
Durante l'addestramento del modello O1 vengono generate una serie di ragionamenti intermedi, le cosiddette "catene di pensiero". Ogni passaggio esplicita una parte del ragionamento per raggiungere una conclusione.
Un secondo modello (verifier) valuta queste catene di pensiero.
Quelle che conducono a risposte corrette sono premiate, mentre le catene errate vengono scartate. Questo affinamento migliora l'accuratezza e la coerenza del modello.
Nota. Le catene di pensiero usate per l'addestramento del modello verificatore includono risposte conosciute, garantendo così che il sistema apprenda dagli errori e costruisca risposte efficaci.
Al termine dell'addestramento il nuovo modello LLM viene messo a disposizione degli utenti.
Quando l'utente digita un prompt, il modello genera più catene di pensiero per una stessa domanda e seleziona quella più promettente. Questo assicura una risposta ragionata e ben costruita.
Nota. Il modello verifier viene utilizzato soltanto in fase di addestramento del modello. Non viene richiamato durante il prompting degli utenti.
In questo modo, ogni passaggio logico è visibile e comprensibile. Problemi che richiedono più passaggi logici vengono affrontati con maggiore precisione.
Esempio pratico
Digito questo prompt su ChatGPT O1:
"Se un treno viaggia a 100 km/h e aumenta la sua velocità a 150 km/h in 10 minuti, qual è l'accelerazione media?"
A questo punto il modello LLM suddivide il problema in blocchi e genera diverse catene di pensiero (Chain of Thought).
Poi sceglie quella più migliore. Ad esempio.
- Convertire la variazione di velocità da km/h a m/s: \( \Delta v = 50 \, \text{km/h} = 13,89 \, \text{m/s} \).
- Convertire il tempo da minuti a secondi: \( \Delta t = 10 \, \text{min} = 600 \, \text{s} \).
- Calcolare l'accelerazione media: \( a = \frac{\Delta v}{\Delta t} = \frac{13,89}{600} \approx 0,023 \, \text{m/s}^2 \).
Infine, il modello mi restituisce il risultato del calcolo
\( 0,023 \, \text{m/s}^2 \).
Questa spiegazione passo per passo migliora l'accuratezza del modello LLM e rende il processo di costruzione della risposta più trasparente.
Il modello O1 è stato rilasciato a settembre 2024 da OpenAI.
Dopo pochi mesi, a dicembre 2024, OpenAI ha rilasciato un nuovo modello ChatGPT O3 che scala le caratteristiche di O1 e le aumenta in termini di potenza, migliorando notevolmente le prestazioni sui benchmark.
E così via.