venerdì, 28 Novembre, 2025
Diritto Dell'informazione - Portale di Informazione
Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Diritti in Rete
    • Libertà d’informazione
    • Fake news
    • Pluralismo e concorrenza
    • Privacy
    • Diffamazione
    • Copyright
    • Tutela dei minori
  • AI
    • Normativa AI
    • Soluzioni AI
    • Etica AI
  • Pubblico e privato
    • Cittadini
    • Cronaca
    • Imprese
    • Enti pubblici
    • Scuola e università
    • Associazioni e movimenti
    • Authority
    • Ordini professionali
    • Fondazioni
    • Cybersecurity
  • Rubriche
    • L’angolo di Ruben Razzante
    • Tecnologie
    • Libri
  • Innovazione
    • Sostenibilità
    • Blockchain
  • YouTube
  • interviste
  • Ultim’ora
Morning News
Nessun risultato
Vedi tutti i risultati
Home Ai

RLHF: COSÌ L’INTELLIGENZA ARTIFICIALE IMPARA A CAPIRCI

Con il Reinforcement Learning from Human Feedback, l’Intelligenza Artificiale impara a generare risposte più utili, sicure e vicine a ciò che l’utente si aspetta

by Redazione
3 Luglio 2025
in Ai
0 0
0
RLHF: COSÌ L’INTELLIGENZA ARTIFICIALE IMPARA A CAPIRCI
0
CONDIVIDI
FacebookShare on TwitterLinkedinWhatsappEmail

Dietro la crescente capacità dei modelli linguistici di rispondere in modo comprensibile, pertinente, cortese e utile, c’è una tecnica chiamata RLHF: Reinforcement Learning from Human Feedback. È la strategia adottata da OpenAI, uno standard per rendere l’Intelligenza Artificiale generativa più allineata alle aspettative umane, combinando addestramento supervisionato, feedback umano e apprendimento per rinforzo.

Il processo si articola in tre fasi. Si parte con il fine-tuning supervisionato (SFT): si prende un modello già addestrato e lo si fa lavorare su esempi scelti da esperti umani. Per ogni domanda (o “prompt”) si fornisce una risposta scritta da persone, che l’AI deve cercare di imitare.

È il primo passo per insegnare al modello a seguire istruzioni in modo coerente.

Nella seconda fase si introduce un modello di ricompensa (Reward Model). Si chiede a gruppi di valutatori umani di confrontare le diverse risposte dell’AI e di scegliere quella che preferiscono. L’AI impara così a riconoscere cosa è più apprezzato, trasformando questi giudizi in numeri che identificano la “qualità” di una risposta.

La terza fase ottimizza la “policy” del modello, cioè le sue scelte, affinché massimizzi la ricompensa assegnata dal modello precedente. Si usa un algoritmo chiamato PPO, che regola quanto il nuovo comportamento possa deviare da quello originale. Troppa libertà rischia di generare output distorti, troppo controllo blocca l’apprendimento.

Questa tecnica ha migliorato drasticamente qualità e sicurezza dei modelli linguistici. Ma ha alcuni limiti: è costosa, dipende da etichettatori umani, può amplificare bias e portare e, in certi casi, “barare”, imparando a ottenere punteggi alti senza davvero migliorare il contenuto.

Per questo la ricerca si sta muovendo verso alternative come il Direct Preference Optimization (che semplifica il processo) e la Constitutional AI (che usa principi scritti al posto di giudizi umani).

L’RLHF ha mostrato che non basta addestrare l’AI tramite testi: serve anche insegnarle come comportarsi. E questo, oggi, lo possiamo fare solo grazie al nostro giudizio, umano.

A.C.


Diritto dell’informazione

“Diritto dell’informazione: la bussola per orientarsi tra notizie e giurisprudenza.”

Continua a seguirci!

▶️ https://dirittodellinformazione.it/chi-siamo/

Tags: addestramento AIAIrisposteutiliRLHF
Plugin Install : Subscribe Push Notification need OneSignal plugin to be installed.

Articoli Correlati - Articolo

DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE
Ai

DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE

27 Novembre 2025
REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE
Ai

REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE

27 Novembre 2025
LA DICHIARAZIONE D’INTENTI SU MINORI E AI È STATA CONSEGNATA AL PAPA
Ai

LA DICHIARAZIONE D’INTENTI SU MINORI E AI È STATA CONSEGNATA AL PAPA

26 Novembre 2025
AI E TUTELA DEI MINORI: CHE COSA DICE LA LEGGE SULL’AI
Ai

AI E TUTELA DEI MINORI: CHE COSA DICE LA LEGGE SULL’AI

26 Novembre 2025
IL GIAPPONE DIFENDE MANGA E ANIME E SI APPELLA AL COPYRIGHT: SCONTRO CON OPENAI
Ai

IL GIAPPONE DIFENDE MANGA E ANIME E SI APPELLA AL COPYRIGHT: SCONTRO CON OPENAI

25 Novembre 2025
Il BINOMIO DI GENAI E PLATFORM THINKING PER LO SVILUPPO AZIENDALE
Ai

Il BINOMIO DI GENAI E PLATFORM THINKING PER LO SVILUPPO AZIENDALE

25 Novembre 2025

PORTALE SVILUPPATO DA

MyWebSolutions Web Agency

Categorie Articoli

News Popolari

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

È REATO PUBBLICARE FOTO DI MINORI SENZA IL CONSENSO DEI GENITORI?

27 Dicembre 2022
CHI SONO E COSA FANNO GLI INFLUENCER

CHI SONO E COSA FANNO GLI INFLUENCER

29 Novembre 2021
WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

WHATSAPP, E-MAIL E SMS HANNO VALORE DI PROVA LEGALE

25 Gennaio 2023
Tutela del diritto d’autore e download di giornali e notizie

Tutela del diritto d’autore e download di giornali e notizie

17 Aprile 2020
DIFFAMAZIONE, INGIURIA E SOCIAL NETWORK

CHAT DI GRUPPO SU WHATSAPP E DIFFAMAZIONE, LA NUOVA SENTENZA DELLA CORTE DI CASSAZIONE

10 Gennaio 2023

In rilievo

FRANCIA, 35 GIORNALISTI SOTTO SCORTA

FRANCIA, 35 GIORNALISTI SOTTO SCORTA

17 Febbraio 2022
“IL CERIMONIALE PONTIFICIO È COMUNICAZIONE”

“IL CERIMONIALE PONTIFICIO È COMUNICAZIONE”

15 Febbraio 2023
L’USO DEI LEAK PONE ALCUNI INTERROGATIVI SULLA LIBERTÀ DI INFORMAZIONE

L’USO DEI LEAK PONE ALCUNI INTERROGATIVI SULLA LIBERTÀ DI INFORMAZIONE

27 Settembre 2023
ALLERTA TRUFFE SUGLI AIUTI PER L’UCRAINA

ALLERTA TRUFFE SUGLI AIUTI PER L’UCRAINA

24 Marzo 2022
ACQUISTA ORAACQUISTA ORAACQUISTA ORA

RR Consulting

E-mail: redazione.dirittodellin
formazione@gmail.com

Condividi sui Social

Ultimi articoli pubblicati

  • DIGITAL OMNIBUS: LA GRANDE RIFORMA DIGITALE DELL’UE 27 Novembre 2025
  • REALTÀ VIRTUALE (VR) E PSICOLOGIA: NUOVE SCOPERTE 27 Novembre 2025
  • L’INTELLIGENCE ITALIANA COMPIE 100 ANNI 27 Novembre 2025

Categorie articoli

Cerca articolo per mese…

Cerca articolo per nome…

Nessun risultato
Vedi tutti i risultati

Calendario Pubblicazioni

Novembre 2025
L M M G V S D
 12
3456789
10111213141516
17181920212223
24252627282930
« Ott    
  • Privacy policy
  • Cookie Policy

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Nessun risultato
Vedi tutti i risultati
  • Home
  • Chi siamo
  • Dicono di noi
  • Authority
  • Deontologia dei giornalisti
  • Diffamazione
  • Diritto all’oblio
  • Fake news
  • Libertà d’informazione
  • Eventi
  • Tutela dei minori
  • Copyright
  • Privacy
    • Cittadini
    • Imprese

© 2019 Diritto dell'informazione - P.IVA:06530190963 - Created by MyWebSolutions - Web Agency

Area riservata ai relatori - Accedi al tuo account inserendo il tuo nome utente e la tua password...

Password dimenticata?

Fill the forms bellow to register

All fields are required. Entra

Recupera la tua password

Inserisci il tuo nome utente o indirizzo e-mail per reimpostare la password.

Entra