Si chiama Emma ed è l’ultima AI tutta italiana presentata sul mercato da Egomnia S.p.A., PMI attiva nei servizi ICT guidata dal fondatore Matteo Achilli.
Sviluppata da Egomnia S.p.A., la società guidata da Matteo Achilli (noto in passato alle cronache come “lo Zuckerberg italiano” e la cui storia ha ispirato il film The Startup), Emma è stata battezzata con il nome della figlia del fondatore. Nel giro di pochissime ore dal suo debutto online, il chatbot è diventato un fenomeno assolutamente virale su X (ex Twitter), Reddit e LinkedIn.
Lanciata con l’ambizioso obiettivo di garantire un’infrastruttura digitale indipendente, protetta dal GDPR e addestrata specificamente sulla nostra lingua, Emma è diventata nel giro di poche ore un caso virale sui social network e sui forum di settore. Il motivo? Una serie di errori macroscopici, allucinazioni e risposte non-sense che hanno sollevato forti dubbi sull’effettiva maturità del progetto.
Perché Emma è virale?
Memorabile lo screenshot in cui, alla domanda su quante “r” ci fossero nella parola giallo, l’AI ha risposto definendo il colore “un numero”. In altri test ha asserito con sicurezza che “un chilo di pane pesa più di un chilo di piume“. Ha generato anche dati totalmente inventati sulla popolazione di “goblin” residenti nelle varie regioni d’Italia.
L’ironia si è concentrata soprattutto su un post satirico, circolato tra le community di finanza e tech, che recitava: “Emma, l’AI tutta italiana che ci libererà dalla tirannia americana di OpenAI e Anthropic, mi sta dando ottimi consigli finanziari”, a corredo di schermate di puro non-sense logico.
I numeri dietro Emma: perché l’AI italiana commette così tanti errori?
Per comprendere le ragioni dietro le risposte bizzarre fornite dal chatbot, è necessario analizzare la scheda tecnica del modello rilasciato.
Il modello di punta attualmente accessibile al pubblico è Emma-5, che conta appena 550,4 milioni di parametri. Nel panorama globale dei Large Language Models (LLM), si tratta di una taglia estremamente ridotta. Per fare un paragone, i moderni “Small Language Models” (modelli leggeri pensati per l’uso locale) partono da una base che va dai 3 ai 7 miliardi di parametri, mentre i giganti di frontiera come GPT o Claude superano le centinaia di miliardi.
Con una quantità così limitata di parametri e una finestra di contesto di soli 2048 token, Emma dispone di uno “spazio computazionale” troppo stretto per poter elaborare relazioni complesse tra concetti, sfumature linguistiche profonde e conoscenze generali in modo generalista e robusto.
Bias strutturali e il problema dell’allineamento
Oltre ai limiti di calcolo, la community di sviluppatori ha evidenziato forti criticità nell’allineamento (alignment) e nella gestione dei bias. Quando un modello viene pre-addestrato su dataset ristretti (in questo caso circa 10,8 miliardi di token), il rischio di risposte distorte, allucinazioni grafiche o fallimenti logici elementari aumenta esponenzialmente.
I test effettuati dagli utenti hanno mostrato come l’algoritmo faccia fatica non solo nei calcoli o nei compiti metalinguistici (come accorgersi se una frase parla di se stessa), ma tenda a generare stringhe di testo prive di logica sintattica se messo sotto pressione con prompt minimamente articolati.
