Chi siamo
Redazione
domenica 22 Giugno 2025
  • Login
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
No Result
View All Result
  • Login
No Result
View All Result
OpenAI lancia HealthBench

OpenAI lancia HealthBench | Pixabay @Just_Super - alanews

L’AI applicata alla sanità, OpenAI lancia HealthBench: ecco di cosa si tratta

by Redazione
13 Maggio 2025

OpenAI ha lanciato HealthBench, un framework open source che mette alla prova i modelli linguistici in situazioni cliniche complesse, coinvolgendo 262 medici da 60 paesi

L’affidabilità dei sistemi di intelligenza artificiale (AI) in ambito sanitario è un tema di crescente importanza, poiché non può essere valutata solo attraverso grafici o statistiche astratte. La vera differenza tra un modello utile e uno potenzialmente pericoloso si trova nei dettagli delle interazioni con i pazienti, nella coerenza nell’analisi dei sintomi e nella precisione delle diagnosi. Per affrontare questa sfida, OpenAI ha recentemente lanciato HealthBench, un framework open source concepito per testare i modelli linguistici di grandi dimensioni (LLM) in contesti clinici realistici e complessi.

Collaborazione con professionisti del settore

HealthBench è il risultato della collaborazione con 262 medici provenienti da 60 paesi e specializzati in 26 discipline. Questo approccio mira a colmare il divario esistente tra i benchmark tradizionali, spesso troppo semplificati, e la complessità delle interazioni sanitarie del mondo reale. A differenza dei test a scelta multipla, HealthBench utilizza 5.000 conversazioni strutturate che simulano scambi autentici tra pazienti e professionisti sanitari, affrontando una vasta gamma di temi clinici.

Valutazione delle risposte generate

Le risposte generate dai modelli vengono valutate secondo rubriche elaborate da esperti medici, basate su circa 50.000 criteri distinti che considerano aspetti come l’accuratezza clinica, la completezza e la chiarezza. Questo processo di scoring, sebbene automatizzato, è stato validato rispetto a valutazioni cliniche umane, garantendo così un alto livello di coerenza e ripetibilità.

Risultati significativi e prospettive future

HealthBench si articola in sette macro-categorie che analizzano situazioni di emergenza, la calibrazione delle risposte in base alle competenze dell’interlocutore, la gestione dell’ambiguità e la qualità della comunicazione. Due sezioni aggiuntive, HealthBench Consensus e HealthBench Hard, ampliano le possibilità di analisi, permettendo di esaminare criteri prioritari e conversazioni particolarmente complesse.

I risultati ottenuti finora sono significativi: il modello GPT-3.5 ha raggiunto solo il 16% di efficacia, mentre GPT-4o si è attestato al 32%. Il modello O3 ha impressionato, raggiungendo un punteggio del 60%. Da notare anche il modello GPT-4.1 nano, che ha superato il GPT-4o in termini di prestazioni e ha ridotto i costi di inferenza di venticinque volte. Tuttavia, permangono limiti significativi, come la difficoltà dei modelli nel generare risposte complete e strutturate, un aspetto critico nel settore sanitario.

Nonostante ciò, i modelli hanno dimostrato di produrre risposte superiori a quelle dei medici che operano da soli. Ciò sottolinea l’importanza dell’intervento umano per affinare e convalidare le risposte generate dalle macchine. Questa sinergia tra intelligenza artificiale e competenza clinica potrebbe portare a vantaggi operativi concreti, specialmente nella redazione di documenti clinici e nel supporto alle decisioni diagnostiche.

Il lancio di HealthBench rappresenta un passo significativo verso un’integrazione più responsabile degli LLM nella medicina. Disponibile su GitHub, la piattaforma promuove uno sviluppo collaborativo in cui sviluppatori, ricercatori e professionisti sanitari possono lavorare insieme per definire criteri condivisi e migliorare l’efficacia dei modelli. HealthBench si configura, quindi, non solo come uno strumento di valutazione, ma come un elemento cruciale per affrontare la complessità e l’urgenza del mondo clinico contemporaneo.

Related Posts

Brasile: tragedia in mongolfiera a Santa Catarina, otto vittime e indagini in corso. Il Video
Esteri

Brasile: tragedia in mongolfiera a Santa Catarina, otto vittime e indagini in corso. Il Video

22 Giugno 2025
Politica

MO, Papa leone XVI: “Notizie allarmanti. L’umanità grida e invoca la pace”

22 Giugno 2025
Goult-France-moglie-uccisa-da-una-gang@alanews.it
Esteri

Sparatoria durante un matrimonio in Provenza: 2 morti e tre feriti

22 Giugno 2025
rafformazamento-sicurezza-Roma@alanews.it
Cronaca

Roma, rafforzate le misure di sicurezza su obiettivi Usa dopo raid in Iran

22 Giugno 2025
Calciomercato 2025
Calcio

Calciomercato Oggi: O’Riley attende la Roma, Jacopo Fazzini-Fiorentina, ci siamo, Augello vicino alla Cremonese

22 Giugno 2025
flight_map / Fonte@Flightradar24.com
Cronaca

Crisi e guerre ridisegnano le rotte aeree mondiali, crescono costi e disagi

22 Giugno 2025

Articoli recenti

  • Brasile: tragedia in mongolfiera a Santa Catarina, otto vittime e indagini in corso. Il Video
  • MO, Papa leone XVI: “Notizie allarmanti. L’umanità grida e invoca la pace”
  • Sparatoria durante un matrimonio in Provenza: 2 morti e tre feriti
  • Roma, rafforzate le misure di sicurezza su obiettivi Usa dopo raid in Iran
  • Calciomercato Oggi: O’Riley attende la Roma, Jacopo Fazzini-Fiorentina, ci siamo, Augello vicino alla Cremonese

© 2025 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Cronaca
  • Politica
  • Economia
  • Esteri
  • Sport
  • Spettacoli
  • Salute
  • Tecnologia
  • Cultura
  • Ambiente
  • Chi siamo
  • Redazione

© 2025 Alanews – Smart Media Solutions - Testata giornalistica registrata al tribunale di Roma n° 243/2012 | Gestione editoriale e multimediale Editorially Srl - Via Assisi 21 - 00181 Roma - P.Iva: 16947451007 | Per la pubblicità: NewsCom S.r.l. – Divisione Testate on line - Sede legale: Via Assisi, 15 - 00181 Roma Capitale sociale: Euro 10.000,00 Codice Fiscale, Partita I.V.A. e Iscrizione al Registro delle Imprese di Roma n. 11903571005 | R.E.A. di Roma: 1335869 Visiona le nostre condizioni d'uso e la nostra politica sulla privacy & cookies.

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi