Swiss Mirror – Apertus, l’AI elvetica per il bene pubblico

«Vogliamo fornire un modello di riferimento su come si possa sviluppare un’AI affidabile, sovrana e inclusiva». Così Martin Jaggi, professore di Machine Learning all’EPFL, ha commentato nei giorni scorsi il lancio dell’intelligenza artificiale elvetica che sfida ChatGPT.

Il nome scelto per la tecnologia è latino, Apertus, per sottolineare proprio la volontà di essere aperti e totalmente trasparenti: l’intero processo di sviluppo – compresa l’architettura, i pesi del modello, i dati di addestramento e le ricette utilizzate – è completamente accessibile e pienamente documentato.

Si tratta, in particolare, di un modello linguistico di grandi dimensioni (LLM) sviluppato dalla Scuola Politecnica Federale di Losanna, dall’ETH Zurigo e dal CSCS (Swiss National Supercomputing Centre). In sostanza, è la “base” su cui costruire diverse applicazioni come chatbot, sistemi di traduzione o strumenti educativi.

«Apertus non è un classico esempio di trasferimento tecnologico dalla ricerca al prodotto. Piuttosto, lo vediamo come un motore di innovazione e un mezzo per rafforzare le competenze in AI nella ricerca, nella società e nell’industria», ha sottolineato Thomas Schulthess, direttore del CSCS e Professore all’ETH Zurigo. Difatti, per favorire l’innovazione nell’economia, si è scelto di mettere a disposizione sia la tecnologia di base che l’infrastruttura.

Imanol Schlag, responsabile tecnico del progetto LLM e ricercatore all’ETH Zurigo, ha parlato di un sistema «costruito per il bene pubblico. È tra i pochi LLM completamente aperti di questa scala ed è il primo nel suo genere a incarnare multilinguismo, trasparenza e conformità come principi fondamentali di progettazione».

Si pensi che Apertus è addestrato su 15 trilioni di token (utilizzati per rappresentare il testo in modo che i computer possano comprenderlo) in oltre 1.000 lingue, includendo molti idiomi finora sottorappresentate negli LLM, come lo svizzero tedesco e il romancio.

Ricercatori di intelligenza artificiale, professionisti ed esperti appassionati possono accedere al modello, per sfruttarlo per i propri progetti, tramite due strade: o attraverso il partner strategico Swisscom, oppure scaricandolo da Hugging Face, una piattaforma dedicata a modelli e applicazioni di AI.

In particolare, Apertus è liberamente disponibile in due versioni, da 8 miliardi parametri (più piccolo e più adatto all’uso individuale) e 70 miliardi di parametri. Entrambi sono rilasciati con una licenza open-source permissiva, che ne consente l’uso in ambito educativo e di ricerca, così come in applicazioni sociali e commerciali più ampie.

Sebbene l’installazione di Apertus sia relativamente semplice per professionisti e utenti esperti, per un utilizzo pratico servono componenti aggiuntivi come server, infrastrutture cloud o interfacce dedicate. Pertanto, Swisscom parteciperà a eventi di settore e metterà a disposizione dei partecipanti un’interfaccia ad hoc, semplificando l’interazione con il modello. La società «è orgogliosa di essere tra le prime a implementare questo modello linguistico pionieristico sulla nostra piattaforma svizzera di AI sovrana», ha commentato Daniel Dobos, direttore della Ricerca in Swisscom.

Ma questa innovazione elvetica vuole essere una risorsa per tutto il mondo e sarà promossa ovunque nel globo dalla nonprofit Public AI Inference Utility, il cui responsabile, Joshua Tan, è stato chiaro: «Attualmente, Apertus è il principale modello di AI pubblico: un modello costruito da istituzioni pubbliche, per l’interesse pubblico. È la migliore prova che l’AI può essere considerata un’infrastruttura pubblica, come autostrade, acqua o elettricità».

Dal punto di vista normativo, Apertus è stato sviluppato nel rispetto delle leggi svizzere sulla protezione dei dati, delle leggi svizzere sul diritto d’autore e degli obblighi di trasparenza previsti dall’AI Act europeo. Inoltre, particolare attenzione è stata dedicata all’integrità dei dati e agli standard etici: il corpus di addestramento si basa esclusivamente su dati pubblicamente disponibili.

Tutto questo non è un punto di arrivo ma un punto di partenza. Le versioni future puntano ad esplorare adattamenti specifici per settori come diritto, clima e salute, solo per fare qualche esempio.