Chi siamo
Redazione
sabato 6 Dicembre 2025
  • Login
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
    • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
    • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
No Result
View All Result
  • Login
No Result
View All Result
Home Tecnologia

L’AI applicata alla sanità, OpenAI lancia HealthBench: ecco di cosa si tratta

by Redazione
13 Maggio 2025
OpenAI lancia HealthBench

OpenAI lancia HealthBench | Pixabay @Just_Super - alanews

OpenAI ha lanciato HealthBench, un framework open source che mette alla prova i modelli linguistici in situazioni cliniche complesse, coinvolgendo 262 medici da 60 paesi

L’affidabilità dei sistemi di intelligenza artificiale (AI) in ambito sanitario è un tema di crescente importanza, poiché non può essere valutata solo attraverso grafici o statistiche astratte. La vera differenza tra un modello utile e uno potenzialmente pericoloso si trova nei dettagli delle interazioni con i pazienti, nella coerenza nell’analisi dei sintomi e nella precisione delle diagnosi. Per affrontare questa sfida, OpenAI ha recentemente lanciato HealthBench, un framework open source concepito per testare i modelli linguistici di grandi dimensioni (LLM) in contesti clinici realistici e complessi.

Collaborazione con professionisti del settore

HealthBench è il risultato della collaborazione con 262 medici provenienti da 60 paesi e specializzati in 26 discipline. Questo approccio mira a colmare il divario esistente tra i benchmark tradizionali, spesso troppo semplificati, e la complessità delle interazioni sanitarie del mondo reale. A differenza dei test a scelta multipla, HealthBench utilizza 5.000 conversazioni strutturate che simulano scambi autentici tra pazienti e professionisti sanitari, affrontando una vasta gamma di temi clinici.

Valutazione delle risposte generate

Le risposte generate dai modelli vengono valutate secondo rubriche elaborate da esperti medici, basate su circa 50.000 criteri distinti che considerano aspetti come l’accuratezza clinica, la completezza e la chiarezza. Questo processo di scoring, sebbene automatizzato, è stato validato rispetto a valutazioni cliniche umane, garantendo così un alto livello di coerenza e ripetibilità.

Risultati significativi e prospettive future

HealthBench si articola in sette macro-categorie che analizzano situazioni di emergenza, la calibrazione delle risposte in base alle competenze dell’interlocutore, la gestione dell’ambiguità e la qualità della comunicazione. Due sezioni aggiuntive, HealthBench Consensus e HealthBench Hard, ampliano le possibilità di analisi, permettendo di esaminare criteri prioritari e conversazioni particolarmente complesse.

I risultati ottenuti finora sono significativi: il modello GPT-3.5 ha raggiunto solo il 16% di efficacia, mentre GPT-4o si è attestato al 32%. Il modello O3 ha impressionato, raggiungendo un punteggio del 60%. Da notare anche il modello GPT-4.1 nano, che ha superato il GPT-4o in termini di prestazioni e ha ridotto i costi di inferenza di venticinque volte. Tuttavia, permangono limiti significativi, come la difficoltà dei modelli nel generare risposte complete e strutturate, un aspetto critico nel settore sanitario.

Nonostante ciò, i modelli hanno dimostrato di produrre risposte superiori a quelle dei medici che operano da soli. Ciò sottolinea l’importanza dell’intervento umano per affinare e convalidare le risposte generate dalle macchine. Questa sinergia tra intelligenza artificiale e competenza clinica potrebbe portare a vantaggi operativi concreti, specialmente nella redazione di documenti clinici e nel supporto alle decisioni diagnostiche.

Il lancio di HealthBench rappresenta un passo significativo verso un’integrazione più responsabile degli LLM nella medicina. Disponibile su GitHub, la piattaforma promuove uno sviluppo collaborativo in cui sviluppatori, ricercatori e professionisti sanitari possono lavorare insieme per definire criteri condivisi e migliorare l’efficacia dei modelli. HealthBench si configura, quindi, non solo come uno strumento di valutazione, ma come un elemento cruciale per affrontare la complessità e l’urgenza del mondo clinico contemporaneo.

Related Posts

La storia di Selvaggia Lucarelli dopo la risposta di Andrea Scanzi sul caso Bergamini
Cronaca

La nuova frattura sul caso Bergamini: la storia Instagram di Lucarelli, il dissenso con Scanzi

5 Dicembre 2025
Frank Gehry
Cronaca

Frank Gehry, maestro dell’architettura contemporanea, si spegne all’età di 96 anni

5 Dicembre 2025
Politica

Meloni: “L’Europa deve capire che per essere grande deve difendersi da sola”

5 Dicembre 2025
Caffè con la Moka
Lifestyle

Vuoi un caffè perfetto da offrire agli amici? Ecco i consigli degli esperti

5 Dicembre 2025
Video

Protesta di Pd e Giovani Democratici a Più Libri Più Liberi contro l’editore Passaggio al Bosco

5 Dicembre 2025
Cronaca

Protesta di Pd e Giovani Democratici a Più Libri Più Liberi, “no al revisionismo”

5 Dicembre 2025

Articoli recenti

  • La nuova frattura sul caso Bergamini: la storia Instagram di Lucarelli, il dissenso con Scanzi
  • Frank Gehry, maestro dell’architettura contemporanea, si spegne all’età di 96 anni
  • Meloni: “L’Europa deve capire che per essere grande deve difendersi da sola”
  • Vuoi un caffè perfetto da offrire agli amici? Ecco i consigli degli esperti
  • Protesta di Pd e Giovani Democratici a Più Libri Più Liberi contro l’editore Passaggio al Bosco

© 2025 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
×
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
    • Calcio
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Video
  • Chi siamo
  • Redazione

© 2025 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.