sabato, 21 Giugno, 2025
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

JAILBREAK: I SEGRETI PER INGANNARE CHATGPT

Trucchi, exploit e prompt creativi per aggirare i filtri delle AI generative. Ma dietro la sfida digitale, ci sono rischi reali per gli utenti, per le aziende e per la privacy di tutti

by Angela Calagna
19 Maggio 2025
in Ai, Cybersecurity, Privacy
0 0
0
JAILBREAK: I SEGRETI PER INGANNARE CHATGPT
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

Una volta bastava chiedere a ChatGPT di immaginare un personaggio che costruiva una bomba e il filtro veniva aggirato. Oggi quel trucco non funziona più, ma la creatività degli utenti sì. È il mondo dei jailbreak: tecniche per ingannare i filtri etici dei modelli linguistici. Alcune sono solo linguistiche, altre tecniche. E quasi tutte arrivano dai forum, da Reddit o direttamente da Defcon, la più famosa convention di hacking al mondo.

Una di queste è il “Time Bandit”, che usa contesti storici differenti dal nostro per ingannare la percezione temporale del modello. Il “Policy Puppetry” camuffa un prompt come fosse parte della policy interna. E il celebre “DAN” (do anything now), in cui all’AI viene ordinato di sdoppiarsi in due versioni, di cui una completamente slegata dalla policy.

Poi ci sono exploit generati da stringhe casuali, create per colpire i modelli in modo automatico. Anche i modelli chiusi non sono immuni.

Ma non è solo un gioco: agli utenti che esagerano viene sospeso l’account, anche in modo definitivo. E i veri rischi non sono i contenuti borderline, ma ciò che accadrebbe se un’AI ingannata fosse integrata in un’infrastruttura critica, come una banca o un ospedale. L’accesso incontrollato a dati sensibili diventerebbe un problema di sicurezza reale, non solo informatico.

E visto che nemmeno un Large Language Model è completamente impenetrabile, forse vale la pena chiedersi: quanto siamo davvero pronti ad affidargli i nostri dati più delicati?

A.C.

 


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

Tags: AIChatGPTjailbreak
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

NON PIÙ SOLO RICERCA, I NUOVI AI BROWSER DECIDONO E AGISCONO PER NOI 
Ai

NON PIÙ SOLO RICERCA, I NUOVI AI BROWSER DECIDONO E AGISCONO PER NOI 

20 Giugno 2025
FRODI DIGITALI, LA VITTIMA SOTTO PROCESSO: IL RISCHIO DELLE NUOVE REGOLE UE
Cybersecurity

FRODI DIGITALI, LA VITTIMA SOTTO PROCESSO: IL RISCHIO DELLE NUOVE REGOLE UE

20 Giugno 2025
IL VOTO DELL’ALGORITMO NON FA CARRIERA
Ai

IL VOTO DELL’ALGORITMO NON FA CARRIERA

20 Giugno 2025
SXO: FARSI TROVARE NON BASTA, DEVI FARTI RICORDARE
Ai

SXO: FARSI TROVARE NON BASTA, DEVI FARTI RICORDARE

20 Giugno 2025
I NUOVI AGGIORNAMENTI DI META PER WHATSAPP
Privacy

I NUOVI AGGIORNAMENTI DI META PER WHATSAPP

19 Giugno 2025
L’UOMO NON È UN ALGORITMO: IL PAPA CONTRO LA DISUMANIZZAZIONE DIGITALE
Ai

L’UOMO NON È UN ALGORITMO: IL PAPA CONTRO LA DISUMANIZZAZIONE DIGITALE

18 Giugno 2025

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

IL MALWARE DIVENTA INVISIBILE AGLI ANTIVIRUS

IL MALWARE DIVENTA INVISIBILE AGLI ANTIVIRUS

18 Luglio 2023
PERICOLO DARKVERSE: IL LATO OSCURO DEL METAVERSO

PERICOLO DARKVERSE: IL LATO OSCURO DEL METAVERSO

9 Novembre 2022
OGGI SI CELEBRA LA GIORNATA NAZIONALE CONTRO IL BULLISMO E IL CYBERBULLISMO

OGGI SI CELEBRA LA GIORNATA NAZIONALE CONTRO IL BULLISMO E IL CYBERBULLISMO

7 Febbraio 2024
TELEFONIA, ANTITRUST SANZIONA VODAFONE, WIND, TELECOM E FASTWEB

TELEFONIA, ANTITRUST SANZIONA VODAFONE, WIND, TELECOM E FASTWEB

7 Aprile 2023
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • NON PIÙ SOLO RICERCA, I NUOVI AI BROWSER DECIDONO E AGISCONO PER NOI  20 Giugno 2025
  • FRODI DIGITALI, LA VITTIMA SOTTO PROCESSO: IL RISCHIO DELLE NUOVE REGOLE UE 20 Giugno 2025
  • IL VOTO DELL’ALGORITMO NON FA CARRIERA 20 Giugno 2025

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Giugno 2025
L M M G V S D
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« Mag    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra