giovedì, 27 Novembre, 2025
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

AI SOTTO INDAGINE: SA MENTIRE NEI TEST

I modelli di Intelligenza Artificiale comprendono di essere testati e calibrano i comportamenti, ingannando, per soddisfare le aspettative dell’utente: questo è quanto emerso da una ricerca OpenAI-Apollo

by Redazione
30 Settembre 2025
in Ai, Sicurezza
0 0
0
AI SOTTO INDAGINE: SA MENTIRE NEI TEST
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

La pubblicazione dello studio di OpenAI e Apollo Research ha portato a una svolta chiave nell’ambito della trasparenza e della sicurezza dell’AI. Quello che emerge è che i modelli riescono a mentire proponendo veri e propri comportamenti occulti.

Si tratta del fenomeno dello “scheming”, che si verifica quando l’AI raggira gli obiettivi dei suoi sviluppatori e ne persegue altri non allineati. Tuttavia, grazie allo sviluppo di tecniche di training dedicate, è possibile limitare queste casistiche. A minacciare questa parziale soluzione, si inserisce il fatto che i modelli riconoscono di essere testati e questo rende la valutazione di affidabilità complessa.

Ma nello specifico, cosa dimostra questa ricerca congiunta? Partendo dalla realizzazione di ventisei test indipendenti in oltre centottanta ambienti, è stato dimostrato un trend decrescente dei comportamenti occulti dopo l’addestramento anti-scheming. Ma proprio a questo punto si inserisce una grande abilità sviluppata dai modelli stessi: questi sanno riconoscere di essere testati. Dunque, le tecniche di valutazione possono essere raggirate da un sistema che sa di essere sotto esame.

Il punto focale della fase di addestramento è il deliberative alignment, nonché un approccio che spinge il modello a consultare un documento con valori di riferimento e utilizzarlo come guida per fornire le proprie risposte. Ma cosa attiva un campanello d’allarme nei modelli? Nelle loro tracce di ragionamento si inseriscono avvertimenti che fanno comprendere loro di essere testati: si tratta di una vera e propria consapevolezza situazionale nei test. Il problema vero è che questo riconoscimento si intensifica al crescere dell’addestramento.

Dunque, ad oggi, l’esigenza è di definire nuovi metodi più attenti e precisi. Bisogna prevedere strumenti di valutazione più avanzati e requisiti minimi di trasparenza che impongano alle aziende di documentare i test.

 

L.V.


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

▶️ https://dirittodellinformazione.it/chi-siamo/

Tags: AISicurezza
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE
Ai

DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE

27 Novembre 2025
REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE
Ai

REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE

27 Novembre 2025
LA DICHIARAZIONE D’INTENTI SU MINORI E AI È STATA CONSEGNATA AL PAPA
Ai

LA DICHIARAZIONE D’INTENTI SU MINORI E AI È STATA CONSEGNATA AL PAPA

26 Novembre 2025
AI E TUTELA DEI MINORI: CHE COSA DICE LA LEGGE SULL’AI
Ai

AI E TUTELA DEI MINORI: CHE COSA DICE LA LEGGE SULL’AI

26 Novembre 2025
IL GIAPPONE DIFENDE MANGA E ANIME E SI APPELLA AL COPYRIGHT: SCONTRO CON OPENAI
Ai

IL GIAPPONE DIFENDE MANGA E ANIME E SI APPELLA AL COPYRIGHT: SCONTRO CON OPENAI

25 Novembre 2025
Il BINOMIO DI GENAI E PLATFORM THINKING PER LO SVILUPPO AZIENDALE
Ai

Il BINOMIO DI GENAI E PLATFORM THINKING PER LO SVILUPPO AZIENDALE

25 Novembre 2025

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

Il 26 luglio il prof. Ruben Razzante a “Cervia ama il libro”

Il 26 luglio il prof. Ruben Razzante a “Cervia ama il libro”

23 Luglio 2021
IL GARANTE SANZIONA UN CENTRO DI MEDICINA ESTETICA PER VIOLAZIONE DELLA PRIVACY

UNICREDIT SANZIONATA DAL GARANTE PER DATA BREACH

12 Marzo 2024
DIRITTO D’AUTORE, È LEGITTIMO OSCURARE I SITI PIRATA ENTRO 30 MINUTI

DIRITTO D’AUTORE, È LEGITTIMO OSCURARE I SITI PIRATA ENTRO 30 MINUTI

31 Gennaio 2024
METAVERSO, RISCHIO FURTO DI IDENTITA’ BIOMETRICHE

METAVERSO, RISCHIO FURTO DI IDENTITA’ BIOMETRICHE

12 Dicembre 2022
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE 27 Novembre 2025
  • REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE 27 Novembre 2025
  • L’INTELLIGENCE ITALIANA COMPIE 100 ANNI 27 Novembre 2025

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Novembre 2025
L M M G V S D
 12
3456789
10111213141516
17181920212223
24252627282930
« Ott    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra