Si tratta di sistemi open source, al momento disponibili quasi esclusivamente in forma di codice su GitHub, basati sul modello GPT-4: il più noto si chiama AutoGPT. Sono software che permettono di creare agenti autonomi basati su IA in grado di arrivare a una soluzione attraverso una serie di passaggi che possono comprendere anche azioni come la ricerca sul Web o l’esecuzione di codice.
“Oggi ChatGPT consente di eseguire un compito alla volta. Sempre a partire da uno stimolo di un essere umano (il cosiddetto prompt, ndr) sistemi come AutoGPT sono invece capaci di arrivare al risultato desiderato per passaggi intermedi, in modo autonomo, tra l’altro oltrepassando i limiti di token di GPT-4. Ci sono tante possibilità di utilizzo: qualcuno l’ha usato per fare ricerche di mercato, altri per avere un assistente nella ricerca scientifica” – ha spiegato Pietro Schirano, a capo dell’intelligenza artificiale della fintech statunitense Brex.
Il processo lo spiega bene, con un’analogia, Andrej Karpathy, tra i soci fondatori di OpenAI, in un thread su Twitter: “Ogni generazione di GPT può essere paragonata a un pensiero – ha scritto – Se questi vengono connessi e legati, è possibile creare agenti in grado di agire in modo autonomo sulla base di un obiettivo definito”.
Da un punto di vista tecnico, AutoGPT è di fatto un software basato sulle versioni 4 e 3.5 di GPT, che viene utilizzato per interpretare gli obiettivi degli utenti, stabilire una linea d’azione e creare le istituzioni intermedie. È dotato di una memoria a medio-lungo termine che gli consente di ricordare i passaggi del ragionamento e può accedere al Web, oltre che a file e a tutto quanto l’utente gli mette a disposizione.
Ne esistono già molte versioni, per ora disponibili per gli sviluppatori: oltre ad AutoGPT, ci sono BabyAGI e Jarvis, di Microsoft. Ce n’è anche una prima variante aperta sul Web, per un pubblico di non addetti ai lavori che si chiama AgentGPT alla quale si accede dal browser.
Il sistema è ancora in una fase embrionale, è probabilmente ancora lontano dal rappresentare una risorsa di automazione credibile per il grande pubblico. “Si tratta di una risorsa ancora nella sua infanzia a volte si blocca, non finisce il compito che si è assegnata o si perde in passaggi troppo complessi. Detto questo, sta migliorando a velocità impressionante” – ha concluso Schirano.
(V.M)