venerdì, 15 Maggio, 2026
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

JAILBREAK: I SEGRETI PER INGANNARE CHATGPT

Trucchi, exploit e prompt creativi per aggirare i filtri delle AI generative. Ma dietro la sfida digitale, ci sono rischi reali per gli utenti, per le aziende e per la privacy di tutti

by Redazione
19 Maggio 2025
in Ai, Cybersecurity, Privacy
0 0
0
JAILBREAK: I SEGRETI PER INGANNARE CHATGPT
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

Una volta bastava chiedere a ChatGPT di immaginare un personaggio che costruiva una bomba e il filtro veniva aggirato. Oggi quel trucco non funziona più, ma la creatività degli utenti sì. È il mondo dei jailbreak: tecniche per ingannare i filtri etici dei modelli linguistici. Alcune sono solo linguistiche, altre tecniche. E quasi tutte arrivano dai forum, da Reddit o direttamente da Defcon, la più famosa convention di hacking al mondo.

Una di queste è il “Time Bandit”, che usa contesti storici differenti dal nostro per ingannare la percezione temporale del modello. Il “Policy Puppetry” camuffa un prompt come fosse parte della policy interna. E il celebre “DAN” (do anything now), in cui all’AI viene ordinato di sdoppiarsi in due versioni, di cui una completamente slegata dalla policy.

Poi ci sono exploit generati da stringhe casuali, create per colpire i modelli in modo automatico. Anche i modelli chiusi non sono immuni.

Ma non è solo un gioco: agli utenti che esagerano viene sospeso l’account, anche in modo definitivo. E i veri rischi non sono i contenuti borderline, ma ciò che accadrebbe se un’AI ingannata fosse integrata in un’infrastruttura critica, come una banca o un ospedale. L’accesso incontrollato a dati sensibili diventerebbe un problema di sicurezza reale, non solo informatico.

E visto che nemmeno un Large Language Model è completamente impenetrabile, forse vale la pena chiedersi: quanto siamo davvero pronti ad affidargli i nostri dati più delicati?

A.C.

 


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

Tags: AIChatGPTjailbreak
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

“MENTRE GUARDI NETFLIX, NETFLIX GUARDA TE”: IL TEXAS PORTA LA PIATTAFORMA IN TRIBUNALE
Dati personali

“MENTRE GUARDI NETFLIX, NETFLIX GUARDA TE”: IL TEXAS PORTA LA PIATTAFORMA IN TRIBUNALE

15 Maggio 2026
L’ANIMA DEGLI ALGORITMI: REGOLE ETICHE PER L’AI
Ai

L’ANIMA DEGLI ALGORITMI: REGOLE ETICHE PER L’AI

15 Maggio 2026
IN ASIA LA SCUOLA DIVENTA INFRASTRUTTURA DEL FUTURO
Ai

IN ASIA LA SCUOLA DIVENTA INFRASTRUTTURA DEL FUTURO

14 Maggio 2026
QUANDO L’AI PENSA AL POSTO NOSTRO: IL RISCHIO NASCOSTO DIETRO DIECI MINUTI DI UTILIZZO
Ai

QUANDO L’AI PENSA AL POSTO NOSTRO: IL RISCHIO NASCOSTO DIETRO DIECI MINUTI DI UTILIZZO

14 Maggio 2026
AI ACT: RINVIO STRATEGICO E STRETTA SUI DEEPFAKE SESSUALI
Ai

AI ACT: RINVIO STRATEGICO E STRETTA SUI DEEPFAKE SESSUALI

13 Maggio 2026
QUANDO L’AI DIVENTA INGANNO: LA REALTÀ MANIPOLATA CHE CORRE ONLINE
Ai

QUANDO L’AI DIVENTA INGANNO: LA REALTÀ MANIPOLATA CHE CORRE ONLINE

13 Maggio 2026

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

MILANO, BANDO PER RAFFORZARE LA TUTELA DEI DIRITTI DEI CITTADINI

LA LOMBARDIA STANZIA 3,6 MILIONI PER LE POLITICHE DELLA FAMIGLIA

29 Ottobre 2021
ALLUCINAZIONI: QUANDO L’AI INVENTA LA REALTA’

ALLUCINAZIONI: QUANDO L’AI INVENTA LA REALTA’

20 Marzo 2026
IL PAPA TORNA A CONDANNARE LE FAKE NEWS

IL PAPA TORNA A CONDANNARE LE FAKE NEWS

20 Luglio 2022
INTELLIGENZE ARTIFICIALI NELLA CREAZIONE DI NOTIZIE: RISCHIO DI DISINFORMAZIONE?

CLAUDE O CHATGPT?

13 Giugno 2023
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • L’EUROPA SFIDA I SOCIAL: “BASTA PROFITTI SULL’ATTENZIONE DEI MINORI” 15 Maggio 2026
  • “MENTRE GUARDI NETFLIX, NETFLIX GUARDA TE”: IL TEXAS PORTA LA PIATTAFORMA IN TRIBUNALE 15 Maggio 2026
  • L’ANIMA DEGLI ALGORITMI: REGOLE ETICHE PER L’AI 15 Maggio 2026

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Maggio 2026
L M M G V S D
 123
45678910
11121314151617
18192021222324
25262728293031
« Apr    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra