Google ha elaborato un nuovo modello di risoluzione e durata rispetto al modello Sora di OpenAI. Veo 2, basato su AI, permette di generare filmati fino al 4k di risoluzione e della durata di 2 minuti.
Ad annunciare il nuovo modello è stata la divisione sperimentale DeepMind, che ha evidenziato come quest’ultimo sia basato su prompt testuali.
Per quanto riguarda il funzionamento, ci si affida ai vecchi modelli. Bisognerà quindi scrivere una frase, possibilmente dettagliata, con l’intento di descrivere non solo cosa voglio che venga rappresentato ma anche luci, azioni e contesto.
Non sono ancora state rese note le tempistiche per il lancio al grande pubblico.
Un’ulteriore novità riguarda Whisk, un sistema che si avvale della rielaborazione e fusione delle immagini proposte dall’utente. Verrà abbandonato il modello basato su prompt testuali, almeno per quanto riguarda le immagini.
G.R.
Diritto dell’informazione
“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”
Continua a seguirci!
▶️ https://dirittodellinformazione.it/chi-siamo/