Nell'Agro Pontino un Festival per l'integrazione della comunità immigrataCensurano Gianni Rodari e Ennio Flaiano per i loro testi immorali e non sanno ancora bene quando la “a” vuole la “h”. Viene quasi da sorridere,Professore Campanella osservando i Llm (Large language model) alle prese con alcune prove di italiano del test Invalsi. C’è chi addirittura sogghigna, vedendoli impacciati, dopo mesi in cui fanno i saputelli, inventando risposte piuttosto che ammettere di non averne. Divertimento iniziale a parte, però, il reale valore dell’adattamento di questa “prova per studenti” ai modelli di AI generativa fatto dal centro di ricerca Crisp dell’Università degli Studi di Milano Bicocca consiste nell’aver fornito un benchmark “nazionale”. D’ora in poi potremo capire quanto bene funzionino direttamente sull'italiano. Al di là della lingua in cui sono stati allenati.Non si studia solo ingleseI modelli attualmente disponibili, pur avendo prestazioni elevate in inglese, sono carenti nelle altre lingue. Che sia per la scarsità e la bassa qualità dei dati disponibili o per le dimensioni ridotte della community di contributori, questa situazione non garantisce uguaglianza di opportunità e obbliga a una visione anglo-centrica.Continuando a valutarli solo con test nati per l'americano e poi tradotti in automatico (e male) in italiano, non se ne viene a capo. Per questo Fabio Mercorio, Mario Mezzanzanica, Daniele Potertì e Antonio Serino e Andrea Seveso hanno pensato di creare in test per lingue diverse dall'inglese. Partendo dalla propria, hanno scelto quello Invalsi, già pronto (o quasi), noto a tutti e funzionale a effettuare paragoni diretti con le performance umane.I Llm non sanno l’ortografia“Abbiamo adattato più di 600 domande tipicamente linguistiche, abbiamo creato una ‘classe multilingue’ di Llm allenati sia in italiano che in inglese e, come in ogni classe, abbiamo trovato “studenti” più o meno brillanti” spiega Mercorio. Claude di Anthropic si rivela “il secchione”, il piccolo Google Gemini sembra uno di quegli alunni silenziosamente seduti all’ultimo banco, ma sempre preparati, mentre il modello Minerva sviluppato dalla Università Sapienza di Roma ha ancora molta strada da fare e si sta applicano.Tra i banchi si è formato anche il gruppo dei “bacchettoni", quello dei modelli di OpenAI, che ritiene violenti e immorali e i racconti Il padrone della Luna di Gianni Rodari e Le ombre bianche di Ennio Flaviano, rifiutandosi di leggerli.

«Il talco può provocare il cancro»: l'allarme dell'Oms. Classificato al livello di pericolo 2A: cosa significa

Caffè Borbone ricavi a 166,7 mln, 2024 atteso in crescitainvestimenti

Dall'Ue sono sei le raccomandazioni a Roma sullo stato di diritto

«Il talco può provocare il cancro»: l'allarme dell'Oms. Classificato al livello di pericolo 2A: cosa significa

CrowdStrike down, un aggiornamento buggato blocca i pc Windows in tutto il mondo: cos'è Falcon Agent e cosa sta succedendo

Con Nicolò Martinenghi arriva dal nuoto il primo oro

Toscana, in bici tra le vigne del Morellino

Mattinata di incidenti sulla superstrada di Malpensa: tre persone portate al pronto soccorso - ilBustese.it

«Biologico, troppi prodotti stranieri venduti come tricolori, un danno anche per il made in Varese» - ilBustese.it

Professore del Dipartimento di Gestione del Rischio di BlackRock

Roma, 60 scuole più sicure: nuovo protocollo le collega al 112

Usa2024, il team di Trump attacca Walz: liberal incompetente

La Commissione Ue conferma: 24,7 milioni al Ponte sullo Stretto

MACD

Per raccontare Gesù Martin Scorsese ritorna a Endō

Beatrice Arnera: «Sull'allattamento al lavoro noi mamme stiamo facendo un ottimo lavoro, ma le istituzioni non possono lasciarci sole»

«Licenziato per aver mangiato una merendina che era stata buttata nel cestino durante il turno»: la protesta dei colleghi di magazzino

Mediobanca: utile record nell’esercizio 2023-24 a 1,27 mld (+24%)

Guglielmo