giovedì, 22 Gennaio, 2026
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

AI E VALUTAZIONE DI SÉ STESSA

Il grande paradosso contemporaneo è quello di affidare ai sistemi di AI la valutazione di sé stessi, a causa delle limitazioni che emergono dalle altre modalità di test

by Redazione
4 Dicembre 2025
in Ai
0 0
0
AI E VALUTAZIONE DI SÉ STESSA
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

Come è possibile definire il buon funzionamento dei modelli di AI generativa? L’intelligenza delle macchine è misurabile sulla base della loro capacità di ingannare l’essere umano: più una macchina è capace di simulare efficacemente una persona, più è considerata intelligente. Tuttavia, ad oggi è necessario ridefinire i confini entro cui valutiamo il buon funzionamento di un sistema.

Ma quali sono gli strumenti di valutazione contemporanei? La metodologia tradizionalmente adoperata è quella di rivolgere al modello di AI una serie di domande “multiple-choice” e valutarne l’accuratezza. Dunque, calcolando la percentuale delle risposte corrette, è possibile comprenderne l’efficacia. In questo modo si ha una classifica dei modelli sulla base delle loro capacità di risposta.

Qual è il grande rischio in questo processo? Può verificarsi una contaminazione dei dati utili alla fase di addestramento. Più precisamente, è possibile che alcuni modelli conoscano già le domande e le risposte fornite loro durante il test: questo fa sì che alcuni sistemi siano più avvantaggiati di altri. A rendere ancora più complessa la situazione si inserisce la difficoltà di riconoscere quali modelli siano stati contaminati e quali siano “puliti”. Si aggiunge il fatto che i modelli evolvono significativamente nel tempo: una batteria di domande che anni fa appariva complessa, ad oggi può risultare immediata da risolvere. Dunque, i test devono essere continuamente aggiornati con domande sempre più difficili.

Esistono modalità per testare i sistemi di AI più avanzati ed efficienti? Occorre introdurre il concetto di “LLM-as-a-judge”: si tratta di assegnare la valutazione di un “task” a un modello che fa da giudice. Nonostante alcuni studiosi siano scettici al riguardo, sembra essere una strada particolarmente promettente. In altre parole, sarebbero dei modelli di AI a valutare altri modelli di AI: un vero e proprio paradosso.

Ma perdere il filtro umano significherebbe entrare in un circolo vizioso, dove è sempre più difficile capire se il modello di AI stia sbagliando. Tuttavia, le prospettive future sembrano dire altro e l’idea di un’AI che valuta un’altra AI sembra più vicina del previsto.

 

L.V.


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

▶️ https://dirittodellinformazione.it/chi-siamo/ 

Tags: AItestvalutazione
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

IL SETTORE AUTOMOBILISTICO NELL’ERA DELL’INTELLIGENZA ARTIFICALE
Ai

IL SETTORE AUTOMOBILISTICO NELL’ERA DELL’INTELLIGENZA ARTIFICALE

21 Gennaio 2026
LA SPINTA DELL’UNIONE EUROPEA VERSO LE AUTO A GUIDA AUTONOMA E INTEGRATE CON AI
Ai

LA SPINTA DELL’UNIONE EUROPEA VERSO LE AUTO A GUIDA AUTONOMA E INTEGRATE CON AI

21 Gennaio 2026
AI E SETTORE AUTOMOBILISTICO: TRA INNOVAZIONE TECNOLOGICA E DILEMMI ETICI
Ai

AI E SETTORE AUTOMOBILISTICO: TRA INNOVAZIONE TECNOLOGICA E DILEMMI ETICI

21 Gennaio 2026
AVVOCATI SUI SOCIAL: TRA VISIBILITÀ E DEONTOLOGIA
Ai

AVVOCATI SUI SOCIAL: TRA VISIBILITÀ E DEONTOLOGIA

20 Gennaio 2026
LE IMMAGINI FAKE DI MADURO CREATE CON L’AI: LA STORIA VIENE ALTERATA
Ai

LE IMMAGINI FAKE DI MADURO CREATE CON L’AI: LA STORIA VIENE ALTERATA

20 Gennaio 2026
PRIVACY E GESTIONE DEI DATI: ARRIVA LA NUOVA ISO/IEC 27701:2025
Ai

PRIVACY E GESTIONE DEI DATI: ARRIVA LA NUOVA ISO/IEC 27701:2025

20 Gennaio 2026

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

EMERGENZA CLIMATICA, STORICA INTESA IN UNIONE EUROPEA: “CHI INQUINA PAGA”

EMERGENZA CLIMATICA, STORICA INTESA IN UNIONE EUROPEA: “CHI INQUINA PAGA”

14 Febbraio 2023
GOOGLE, STOP A HANGOUTS E BENVENUTO GOOGLE CHAT

GOOGLE, STOP A HANGOUTS E BENVENUTO GOOGLE CHAT

18 Luglio 2022
L’ABRUZZO OSPITA ICSSA, LA CONFERENZA INTERNAZIONALE SULLA CYBER SECURITY PER L’AEREOSPAZIO

L’ABRUZZO OSPITA ICSSA, LA CONFERENZA INTERNAZIONALE SULLA CYBER SECURITY PER L’AEREOSPAZIO

15 Ottobre 2021
DALLA TEORIA ALLA PRATICA: NECESSITÀ DI CRITERI E STANDARD PER L’APPLICABILITÀ DELL’AI

DALLA TEORIA ALLA PRATICA: NECESSITÀ DI CRITERI E STANDARD PER L’APPLICABILITÀ DELL’AI

23 Febbraio 2024
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • IL SETTORE AUTOMOBILISTICO NELL’ERA DELL’INTELLIGENZA ARTIFICALE 21 Gennaio 2026
  • LA SPINTA DELL’UNIONE EUROPEA VERSO LE AUTO A GUIDA AUTONOMA E INTEGRATE CON AI 21 Gennaio 2026
  • AI E SETTORE AUTOMOBILISTICO: TRA INNOVAZIONE TECNOLOGICA E DILEMMI ETICI 21 Gennaio 2026

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Gennaio 2026
L M M G V S D
 1234
567891011
12131415161718
19202122232425
262728293031  
« Dic    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra