giovedì, 18 Giugno, 2026
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

AI SOTTO INDAGINE: SA MENTIRE NEI TEST

I modelli di Intelligenza Artificiale comprendono di essere testati e calibrano i comportamenti, ingannando, per soddisfare le aspettative dell’utente: questo è quanto emerso da una ricerca OpenAI-Apollo

by Redazione
30 Settembre 2025
in Ai, Sicurezza
0 0
0
AI SOTTO INDAGINE: SA MENTIRE NEI TEST
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

La pubblicazione dello studio di OpenAI e Apollo Research ha portato a una svolta chiave nell’ambito della trasparenza e della sicurezza dell’AI. Quello che emerge è che i modelli riescono a mentire proponendo veri e propri comportamenti occulti.

Si tratta del fenomeno dello “scheming”, che si verifica quando l’AI raggira gli obiettivi dei suoi sviluppatori e ne persegue altri non allineati. Tuttavia, grazie allo sviluppo di tecniche di training dedicate, è possibile limitare queste casistiche. A minacciare questa parziale soluzione, si inserisce il fatto che i modelli riconoscono di essere testati e questo rende la valutazione di affidabilità complessa.

Ma nello specifico, cosa dimostra questa ricerca congiunta? Partendo dalla realizzazione di ventisei test indipendenti in oltre centottanta ambienti, è stato dimostrato un trend decrescente dei comportamenti occulti dopo l’addestramento anti-scheming. Ma proprio a questo punto si inserisce una grande abilità sviluppata dai modelli stessi: questi sanno riconoscere di essere testati. Dunque, le tecniche di valutazione possono essere raggirate da un sistema che sa di essere sotto esame.

Il punto focale della fase di addestramento è il deliberative alignment, nonché un approccio che spinge il modello a consultare un documento con valori di riferimento e utilizzarlo come guida per fornire le proprie risposte. Ma cosa attiva un campanello d’allarme nei modelli? Nelle loro tracce di ragionamento si inseriscono avvertimenti che fanno comprendere loro di essere testati: si tratta di una vera e propria consapevolezza situazionale nei test. Il problema vero è che questo riconoscimento si intensifica al crescere dell’addestramento.

Dunque, ad oggi, l’esigenza è di definire nuovi metodi più attenti e precisi. Bisogna prevedere strumenti di valutazione più avanzati e requisiti minimi di trasparenza che impongano alle aziende di documentare i test.

 

L.V.


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

▶️ https://dirittodellinformazione.it/chi-siamo/

Tags: AISicurezza
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

IL PIANO INDUSTRIALE PER L’AI: RISORSE PER IL VENTURE CAPITAL E RIFORMA DELLA PA
Ai

IL PIANO INDUSTRIALE PER L’AI: RISORSE PER IL VENTURE CAPITAL E RIFORMA DELLA PA

17 Giugno 2026
SICUREZZA E LIMITI BIOMETRICI: IL NUOVO REATO PENALE CHE REGOLA L’INTELLIGENZA ARTIFICIALE
Ai

SICUREZZA E LIMITI BIOMETRICI: IL NUOVO REATO PENALE CHE REGOLA L’INTELLIGENZA ARTIFICIALE

17 Giugno 2026
UMANESIMO DIGITALE: TUTELA DEI LAVORATORI E BENESSERE SCOLASTICO NEI DECRETI AI
Ai

UMANESIMO DIGITALE: TUTELA DEI LAVORATORI E BENESSERE SCOLASTICO NEI DECRETI AI

17 Giugno 2026
UN’ASSESSORA CREATA DALL’AI ENTRA IN COMUNE: INNOVAZIONE O PROVOCAZIONE?
Ai

UN’ASSESSORA CREATA DALL’AI ENTRA IN COMUNE: INNOVAZIONE O PROVOCAZIONE?

16 Giugno 2026
IL PRIMO VACCINO PROGETTATO DALL’AI: UNA NUOVA ERA PER LA MEDICINA
Ai

IL PRIMO VACCINO PROGETTATO DALL’AI: UNA NUOVA ERA PER LA MEDICINA

16 Giugno 2026
SICUREZZA DEI MINORI ONLINE: APPLE POTENZIA I CONTROLLI SU IPHONE E MAC
Ai

SICUREZZA DEI MINORI ONLINE: APPLE POTENZIA I CONTROLLI SU IPHONE E MAC

16 Giugno 2026

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

Comunicazione istituzionale #coronavirus

Comunicazione istituzionale #coronavirus

21 Marzo 2020
OTTOBRE, IL MESE EUROPEO DELLA CYBER SECURITY COMPIE 10 ANNI

OTTOBRE, IL MESE EUROPEO DELLA CYBER SECURITY COMPIE 10 ANNI

20 Ottobre 2022
La Sardegna punta sulle opere strategiche per rilanciare lo sviluppo post-pandemia

La Sardegna punta sulle opere strategiche per rilanciare lo sviluppo post-pandemia

17 Agosto 2021
GMAIL, ANNUNCIATA LA NUOVA FUNZIONE PER IL TRACCIAMENTO DEI PACCHI

GMAIL, ANNUNCIATA LA NUOVA FUNZIONE PER IL TRACCIAMENTO DEI PACCHI

17 Novembre 2022
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • IL PIANO INDUSTRIALE PER L’AI: RISORSE PER IL VENTURE CAPITAL E RIFORMA DELLA PA 17 Giugno 2026
  • SICUREZZA E LIMITI BIOMETRICI: IL NUOVO REATO PENALE CHE REGOLA L’INTELLIGENZA ARTIFICIALE 17 Giugno 2026
  • UMANESIMO DIGITALE: TUTELA DEI LAVORATORI E BENESSERE SCOLASTICO NEI DECRETI AI 17 Giugno 2026

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Giugno 2026
L M M G V S D
1234567
891011121314
15161718192021
22232425262728
2930  
« Mag    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra