Il panorama dell’intelligenza artificiale registra nuovi sviluppi significativi nel campo della logica e della programmazione, evidenziando al contempo evidenti limiti nelle applicazioni operative fisiche. Da un lato, i sistemi sviluppati dalle divisioni di ricerca di Google e OpenAI hanno dimostrato la capacità di elaborare soluzioni per complessi teoremi e congetture formulati dal matematico Paul Erdős, questioni rimaste aperte per decenni, affiancando i modelli linguistici a software di verifica puntuale. Dall’altro, Anthropic ha impiegato la propria architettura per individuare su larga scala vulnerabilità nei codici informatici, arrivando a prevenire gravi frodi finanziarie in ambito bancario. Nonostante le prestazioni in questi settori teorici e digitali, l’implementazione di reti neurali in contesti di vendita al dettaglio mostra ancora criticità pratiche, come evidenziato dal recente ritiro di un sistema di tracciamento automatizzato degli inventari che presentava difficoltà nel riconoscimento visivo dei prodotti.
I traguardi di Google AlphaProof Nexus
Il mondo accademico discute se le macchine possano davvero fare matematica, Google intanto ha rilasciato il sistema AlphaProof Nexus, sviluppato dalla divisione DeepMind, che ha risolto in modo autonomo nove problemi irrisolti del catalogo di Paul Erdős, il celebre matematico ungherese che nel corso della sua carriera ha formulato centinaia di quesiti considerati impossibili…pensate che due di questi problemi erano in attesa di soluzione da 56 anni. Come funziona AlphaProof Nexus? Il sistema combina un modello linguistico di grandi dimensioni con Lean, un software di verifica delle dimostrazioni: l’intelligenza artificiale propone una dimostrazione, Lean ne controlla ogni passaggio logico e, se non regge, la scarta e il processo si ripete fino a quando la prova non viene validata. Ogni soluzione dei nove problemi di Erdős è costata poche centinaia di dollari…i nove problemi risolti riguardano l’analisi combinatoria e la teoria dei grafi, il sistema, inoltre, ha anche dimostrato 44 irrisolte aperte tratte dall’Enciclopedia online delle sequenze di interi (Oeis, Online Encyclopedia of Integer Sequences).
La smentita della congettura da parte di OpenAI
L’annuncio è arrivato il giorno dopo la presentazione di OpenAI, che ha rivendicato la smentita di una congettura geometrica formulata da Erdős nel 1946 rimasta irrisolta per quasi 80 anni e il risultato sembra solido: il matematico Tim Gowers, medaglia Fields nel 1998, lo ha definito «una pietra miliare». OpenAI aveva bisogno di ricostruirsi una credibilità, dopo che mesi fa il suo ex vicepresidente Kevin Weil aveva annunciato la risoluzione di dieci problemi di Erdős, salvo poi scoprire che il modello si era limitato a trovare soluzioni già pubblicate in letteratura. Weil cancellò il post e ad aprile lasciò l’azienda.
L’impiego per la sicurezza informatica
Sul fronte della sicurezza informatica, Anthropic ha pubblicato i primi risultati del Project Glasswing, un’iniziativa che mette a disposizione di una cinquantina di partner il modello Claude Mythos Preview per individuare vulnerabilità nei software: in un solo mese sono state scoperte oltre 10.000 falle di gravità elevata. Giusto per dare qualche numero: Cloudflare ne ha trovate 2.000, Mozilla ne ha corrette 271 nel browser Firefox, dieci volte di più rispetto a quanto individuato con il modello precedente…Anthropic stessa ha analizzato oltre mille progetti open source, segnalando 6.202 vulnerabilità gravi, di cui il 62% confermato dopo un controllo indipendente. Una banca partner ha persino usato Mythos per bloccare un bonifico fraudolento da 1,5 milioni di dollari. Anthropic ha precisato che il modello resta ad accesso limitato perché nessuna azienda, compresa la stessa Anthropic, dispone ancora di contromisure sufficienti per impedirne un uso malevolo.
I limiti del riconoscimento visivo nel retail
C’è anche chi ha ottenuto meno di quanto sperava dall’intelligenza artificiale: Starbucks ha ritirato un sistema automatizzato per l’analisi dell’inventario nei punti vendita del Nord America appena nove mesi dopo averlo introdotto. Lo strumento, basato su sensori e visione artificiale, doveva velocizzare il monitoraggio delle scorte, ma confondeva regolarmente tipi diversi di latte e non rilevava i prodotti sugli scaffali…la soluzione? I dipendenti torneranno al conteggio manuale. Incredibile ma vero, la stessa tecnologia che risolve teoremi inavvicinabili da mezzo secolo, può ancora inciampare davanti a una bottiglia di latte.













