Chi siamo
Redazione
giovedì 5 Febbraio 2026
  • Login
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
    • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
  • Milano Cortina 2026
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
    • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
  • Milano Cortina 2026
No Result
View All Result
  • Login
No Result
View All Result
Home Tecnologia

L’AI applicata alla sanità, OpenAI lancia HealthBench: ecco di cosa si tratta

by Redazione
13 Maggio 2025
OpenAI lancia HealthBench

OpenAI lancia HealthBench | Pixabay @Just_Super - alanews

OpenAI ha lanciato HealthBench, un framework open source che mette alla prova i modelli linguistici in situazioni cliniche complesse, coinvolgendo 262 medici da 60 paesi

L’affidabilità dei sistemi di intelligenza artificiale (AI) in ambito sanitario è un tema di crescente importanza, poiché non può essere valutata solo attraverso grafici o statistiche astratte. La vera differenza tra un modello utile e uno potenzialmente pericoloso si trova nei dettagli delle interazioni con i pazienti, nella coerenza nell’analisi dei sintomi e nella precisione delle diagnosi. Per affrontare questa sfida, OpenAI ha recentemente lanciato HealthBench, un framework open source concepito per testare i modelli linguistici di grandi dimensioni (LLM) in contesti clinici realistici e complessi.

Collaborazione con professionisti del settore

HealthBench è il risultato della collaborazione con 262 medici provenienti da 60 paesi e specializzati in 26 discipline. Questo approccio mira a colmare il divario esistente tra i benchmark tradizionali, spesso troppo semplificati, e la complessità delle interazioni sanitarie del mondo reale. A differenza dei test a scelta multipla, HealthBench utilizza 5.000 conversazioni strutturate che simulano scambi autentici tra pazienti e professionisti sanitari, affrontando una vasta gamma di temi clinici.

Valutazione delle risposte generate

Le risposte generate dai modelli vengono valutate secondo rubriche elaborate da esperti medici, basate su circa 50.000 criteri distinti che considerano aspetti come l’accuratezza clinica, la completezza e la chiarezza. Questo processo di scoring, sebbene automatizzato, è stato validato rispetto a valutazioni cliniche umane, garantendo così un alto livello di coerenza e ripetibilità.

Risultati significativi e prospettive future

HealthBench si articola in sette macro-categorie che analizzano situazioni di emergenza, la calibrazione delle risposte in base alle competenze dell’interlocutore, la gestione dell’ambiguità e la qualità della comunicazione. Due sezioni aggiuntive, HealthBench Consensus e HealthBench Hard, ampliano le possibilità di analisi, permettendo di esaminare criteri prioritari e conversazioni particolarmente complesse.

I risultati ottenuti finora sono significativi: il modello GPT-3.5 ha raggiunto solo il 16% di efficacia, mentre GPT-4o si è attestato al 32%. Il modello O3 ha impressionato, raggiungendo un punteggio del 60%. Da notare anche il modello GPT-4.1 nano, che ha superato il GPT-4o in termini di prestazioni e ha ridotto i costi di inferenza di venticinque volte. Tuttavia, permangono limiti significativi, come la difficoltà dei modelli nel generare risposte complete e strutturate, un aspetto critico nel settore sanitario.

Nonostante ciò, i modelli hanno dimostrato di produrre risposte superiori a quelle dei medici che operano da soli. Ciò sottolinea l’importanza dell’intervento umano per affinare e convalidare le risposte generate dalle macchine. Questa sinergia tra intelligenza artificiale e competenza clinica potrebbe portare a vantaggi operativi concreti, specialmente nella redazione di documenti clinici e nel supporto alle decisioni diagnostiche.

Il lancio di HealthBench rappresenta un passo significativo verso un’integrazione più responsabile degli LLM nella medicina. Disponibile su GitHub, la piattaforma promuove uno sviluppo collaborativo in cui sviluppatori, ricercatori e professionisti sanitari possono lavorare insieme per definire criteri condivisi e migliorare l’efficacia dei modelli. HealthBench si configura, quindi, non solo come uno strumento di valutazione, ma come un elemento cruciale per affrontare la complessità e l’urgenza del mondo clinico contemporaneo.

Related Posts

Fabrizio Corona passa al contrattacco con Mediaset
Cronaca

Fabrizio Corona passa al contrattacco: arriva la denuncia a Mediaset

5 Febbraio 2026
Allarme contaminazione nel latte in polvere
Salute

Allarme latte in polvere: sintomi di avvelenamento per decine di bambini

5 Febbraio 2026
Cyberbullismo
Cronaca

Cyberbullismo in aumento tra i giovani: tocca il 47% dei 15-19enni

5 Febbraio 2026
Due rider Glovo che consegnano in bicicletta cibo ordinato sotto al sole cocente
Economia

Rider, fino a 10 ore al giorno per pochi euro a consegna: l’indagine

5 Febbraio 2026
Agenzia delle Entrate
Economia

Fisco, nel 2025 individuati 200 mila evasori: in arrivo 2,4 milioni di lettere

5 Febbraio 2026
Scontri a Torino il comunicato di Askatasuna
Cronaca

Scontri a Torino, Askatasuna: “Almeno 45 manifestanti soccorsi”

5 Febbraio 2026

Articoli recenti

  • Fabrizio Corona passa al contrattacco: arriva la denuncia a Mediaset
  • Allarme latte in polvere: sintomi di avvelenamento per decine di bambini
  • Cyberbullismo in aumento tra i giovani: tocca il 47% dei 15-19enni
  • Rider, fino a 10 ore al giorno per pochi euro a consegna: l’indagine
  • Fisco, nel 2025 individuati 200 mila evasori: in arrivo 2,4 milioni di lettere

© 2026 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
×
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
  • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
  • Milano Cortina 2026
  • Chi siamo
  • Redazione

© 2026 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.