sabato, 8 Novembre, 2025
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

JAILBREAK: I SEGRETI PER INGANNARE CHATGPT

Trucchi, exploit e prompt creativi per aggirare i filtri delle AI generative. Ma dietro la sfida digitale, ci sono rischi reali per gli utenti, per le aziende e per la privacy di tutti

by Redazione
19 Maggio 2025
in Ai, Cybersecurity, Privacy
0 0
0
JAILBREAK: I SEGRETI PER INGANNARE CHATGPT
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

Una volta bastava chiedere a ChatGPT di immaginare un personaggio che costruiva una bomba e il filtro veniva aggirato. Oggi quel trucco non funziona più, ma la creatività degli utenti sì. È il mondo dei jailbreak: tecniche per ingannare i filtri etici dei modelli linguistici. Alcune sono solo linguistiche, altre tecniche. E quasi tutte arrivano dai forum, da Reddit o direttamente da Defcon, la più famosa convention di hacking al mondo.

Una di queste è il “Time Bandit”, che usa contesti storici differenti dal nostro per ingannare la percezione temporale del modello. Il “Policy Puppetry” camuffa un prompt come fosse parte della policy interna. E il celebre “DAN” (do anything now), in cui all’AI viene ordinato di sdoppiarsi in due versioni, di cui una completamente slegata dalla policy.

Poi ci sono exploit generati da stringhe casuali, create per colpire i modelli in modo automatico. Anche i modelli chiusi non sono immuni.

Ma non è solo un gioco: agli utenti che esagerano viene sospeso l’account, anche in modo definitivo. E i veri rischi non sono i contenuti borderline, ma ciò che accadrebbe se un’AI ingannata fosse integrata in un’infrastruttura critica, come una banca o un ospedale. L’accesso incontrollato a dati sensibili diventerebbe un problema di sicurezza reale, non solo informatico.

E visto che nemmeno un Large Language Model è completamente impenetrabile, forse vale la pena chiedersi: quanto siamo davvero pronti ad affidargli i nostri dati più delicati?

A.C.

 


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

Tags: AIChatGPTjailbreak
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

QUANDO I ROBOT BUSSANO ALL’UFFICIO: NEGLI USA L’INTELLIGENZA ARTIFICIALE SOSTITUISCE IL ‘COLLETTO BIANCO’
Ai

QUANDO I ROBOT BUSSANO ALL’UFFICIO: NEGLI USA L’INTELLIGENZA ARTIFICIALE SOSTITUISCE IL ‘COLLETTO BIANCO’

7 Novembre 2025
CHATGPT E LE CHAT EROTICHE
Ai

CHATGPT E LE CHAT EROTICHE

7 Novembre 2025
PAVEL DUROV E IL SUO APPELLO SU X: “IL TEMPO PER SALVARE L’INTERNET LIBERA STA PER SCADERE”
informazione

PAVEL DUROV E IL SUO APPELLO SU X: “IL TEMPO PER SALVARE L’INTERNET LIBERA STA PER SCADERE”

7 Novembre 2025
COOPERAZIONE TRANSATLANTICA SULL’AI IN FRANTUMI: LA CINA NUOVA PROTAGONISTA?
Ai

COOPERAZIONE TRANSATLANTICA SULL’AI IN FRANTUMI: LA CINA NUOVA PROTAGONISTA?

7 Novembre 2025
FORMAZIONE 4.0
Ai

FORMAZIONE 4.0

7 Novembre 2025
LA CYBERSECURITY NEL MONDO AUTOMOBILISTICO
Cybersecurity

LA CYBERSECURITY NEL MONDO AUTOMOBILISTICO

6 Novembre 2025

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

A LEZIONE DI METAVERSO TRA VIRTUAL, AUGMENTED E MIXED REALITY

A LEZIONE DI METAVERSO TRA VIRTUAL, AUGMENTED E MIXED REALITY

26 Gennaio 2022
IL GOVERNO DELL’INTELLIGENZA ARTIFICIALE

IL GOVERNO DELL’INTELLIGENZA ARTIFICIALE

10 Aprile 2024
I CAMBIAMENTI DELL’IA SULLE RICERCHE ONLINE

I CAMBIAMENTI DELL’IA SULLE RICERCHE ONLINE

3 Marzo 2025
I (SOCIAL) MEDIA CHE VORREI

I (SOCIAL) MEDIA CHE VORREI

17 Maggio 2023
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • QUANDO I ROBOT BUSSANO ALL’UFFICIO: NEGLI USA L’INTELLIGENZA ARTIFICIALE SOSTITUISCE IL ‘COLLETTO BIANCO’ 7 Novembre 2025
  • CHATGPT E LE CHAT EROTICHE 7 Novembre 2025
  • PAVEL DUROV E IL SUO APPELLO SU X: “IL TEMPO PER SALVARE L’INTERNET LIBERA STA PER SCADERE” 7 Novembre 2025

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Novembre 2025
L M M G V S D
 12
3456789
10111213141516
17181920212223
24252627282930
« Ott    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra