Il pregiudizio non è solo negli algoritmi, ma anche nelle parole che scegliamo

Il lancio del modello svizzero Apertus evidenzia come anche una desinenza latina possa portare con sé secoli di peso culturale, sostiene Claudia Vaccarone, esperta in comunicazione inclusiva.

La Svizzera ha appena compiuto un passo coraggioso nel campo dell’intelligenza artificiale (IA). I politecnici federali di Zurigo (ETHZ) e Losanna (EPFL), insieme al Centro svizzero di calcolo scientifico (CSCS), hanno lanciato ApertusCollegamento esterno, il primo modello linguistico multilingue su larga scala open source del Paese.

Il modello è davvero unico nel suo genere perché multilingue fin dalla sua concezione: Apertus è stato addestrato su 15 trilioni di token (parole o parti di parole) provenienti da oltre 1’000 lingue (delle 7’000 parlate oggi nel mondo). Con circa il 40% delle fonti non inglesi, incorpora lingue generalmente sottorappresentate nei modelli linguistici di grandi dimensioni (LLM), come lo svizzero tedesco, il romancio e molte altre.

Dal punto di vista della diversità culturale, questo è un dettaglio molto importante, poiché la stragrande maggioranza dei principali LLM è ancora addestrata soprattutto in inglese. Il motivo è che internet ha molti più contenuti in inglese che in qualsiasi altra lingua e che le più grandi aziende di IA hanno sede negli Stati Uniti e nel Regno Unito e sviluppano i propri prodotti principalmente per i mercati di lingua inglese.

“Il mondo della tecnologia ha una storia ben documentata di squilibrio di genere.”

Nell’attuale iterazione di questi servizi, ciò ha delle conseguenze: il rapporto del 2023 “Lost in TranslationCollegamento esterno” del Center for Democracy & TechnologyCollegamento esterno afferma che i modelli addestrati principalmente su testi in lingua inglese “finiscono per trasferire valori e presupposti codificati in inglese in contesti linguistici diversi, dove potrebbero non essere appropriati. Ad esempio, un modello multilingue potrebbe associare la parola “colomba” alla “pace” in tutte le lingue, anche se la parola basca per colomba (‘uso’) può essere un insulto”.

Quando si utilizzano strumenti basati su LLM in lingue con poche risorse, possono verificarsi più allucinazioni e pregiudizi. Esiste un chiaro rischio di omogeneizzazione linguistica se le lingue minori non vengono incluse deliberatamente: ecco perché progetti come BLOOM e Apertus, sviluppati esplicitamente per dare priorità alla diversità linguistica, sono molto importanti.

Grammatica latina e pregiudizi moderni

Apertus in latino significa “aperto”: in teoria un nome perfetto per uno strumento che promette una trasparenza radicale: a differenza della maggior parte dei modelli di IA commerciali, il codice, i dati e la metodologia di Apertus sono completamente accessibili.

L’uso del latino conferisce inoltre al nome un tocco accademico e atemporale, appropriato per un modello sviluppato da istituzioni svizzere leader come l’EPFL, l’ETHZ e il CSCS. Esso trasmette sovranità digitale e accessibilità dell’intelligenza artificiale.

Tuttavia, un aspetto intrinseco al nome merita la nostra attenzione, soprattutto se prendiamo sul serio in concetto di apertura.

In latino, i nomi e gli aggettivi assumono desinenze diverse a seconda del genere: Apert-a è femminile; Apert-um è neutro; Apert-us è maschile.

Il nome dell’LLM svizzero ha la forma maschile. I dizionari possono elencare il maschile come “predefinito”, ma la scelta non è neutra. Riflette una convenzione di lunga data nelle lingue europee che tratta il maschile come universale, una convenzione così radicata che spesso non la notiamo. Ciò ha contribuito a rendere invisibile il femminile (si pensi alle professioni conosciute solo nella forma maschile) e alla cristallizzazione di una gerarchia patriarcale tra i sessi.

Recenti e solide ricerche sociolinguisticheCollegamento esterno hanno dimostrato come il cervello umano non sia in grado di gestire l’ambiguità del maschile come universale e interpreti il maschile in modo letterale.

I movimenti per un linguaggio inclusivo si sono impegnati a sottolineare la necessità di smantellare l’uso universale del maschile, favorendo forme neutre dal punto di vista del genere.

Perché la scelta del nome Apertus è importante

Scegliere Apertus invece di Aperta o Apertum non è di per sé un errore.

Purtroppo è un riflesso di come il linguaggio stesso codifichi la gerarchia di genere, soprattutto nel mondo scientifico e tecnologico, presentando il maschile come la norma e tutto il resto come una deviazione. Riflette l’abitudine linguistica più ampia di trattare il maschile come universale. Questa abitudine è di per sé una forma di pregiudizio radicato: naturalizza il linguaggio codificato al maschile come “neutro”.

È un’occasione mancata di estendere l’inclusione di genere al marchio di questo strumento di IA innovativo e di per sé linguisticamente inclusivo, e di riconoscere l’impatto e il potere del linguaggio.

Si potrebbe supporre che la scelta della forma maschile in Apertus si accordi con il maschile della parola “modello” nelle lingue di genere (le model in francese, el modelo in spagnolo, das Modell in tedesco, etc.). Ma quando leggo Apertus, come classicista europea e multilingue, vedo più del genere grammaticale; vedo uno schema di scelte linguistiche che riflettono un pregiudizio sociale.

“La Svizzera ha l’opportunità di dimostrare che la vera innovazione significa aprire non solo il nostro codice, ma anche le nostre menti”

Sarebbe interessante saperne di più sul processo creativo che ha portato alla scelta di questo nome: il processo di ideazione è stato interamente umano o è stato un suggerimento di uno degli LLM esistenti? Forse Apertus ha scelto il proprio nome?

Per curiosità, ho chiesto a due LLM, ChatGPT e Gemini, cosa ne pensassero del nome. Entrambi hanno elogiato l’eleganza e la chiarezza di intenti di una parola latina. Ma quando sono stati interrogati sulle implicazioni di genere, le loro risposte sono state divergenti. ChatGPT ha riconosciuto il pregiudizio come “sottile e sistemico”. Gemini, inizialmente, ha liquidato la questione come irrilevante perché “Apertus è un nome, non una persona” e “la maggioranza non conosce il latino”. Solo dopo ulteriori sollecitazioni ha ammesso che l’impostazione predefinita maschile potrebbe rafforzare le norme di esclusione.

Il mondo della tecnologia ha una storia ben documentata di squilibrio di genere. Un nome come “Apertus” rafforza sottilmente l’idea che la tecnologia sia un dominio maschile. È un piccolo segnale, ma fa parte di un modello più ampio. Ogni volta che un nuovo prodotto o progetto assume un nome maschile come impostazione predefinita, contribuisce alla narrativa secondo cui gli uomini sono i principali creatori e utenti in questo campo.

Un approccio neutro dal punto di vista del genere

Se il modello fosse stato denominato utilizzando un approccio neutro dal punto di vista del genere e basato sui diritti umani, il nome avrebbe potuto avere una risonanza diversa. Aperta avrebbe potuto trasmettere apertura anche come accoglienza, inclusività e umanità, mentre Apertum avrebbe potuto sottolineare la neutralità e l’astrazione, facendo eco alla tradizione di neutralità della Svizzera.

Uno dei rischi e dei timori maggiori legati alla tecnologia e agli strumenti di IA è che possano riprodurre le disuguaglianze delle società e delle organizzazioni che li hanno creati. Ma il pregiudizio non vive solo negli algoritmi o nei set di dati, ma anche nel linguaggio stesso.

Riconoscere questa realtà e riflettere intenzionalmente sul nostro uso del linguaggio offre un’occasione unica per tracciare un percorso diverso. In questo modo, Apertus può diventare più di uno strumento: può diventare una lente attraverso la quale esaminare i difetti della nostra società.

L’apertura, dopotutto, non riguarda solo la trasparenza. Riguarda il coraggio di mettere in discussione le norme che spesso fanno sentire invisibile metà della popolazione. La Svizzera ha l’opportunità di dimostrare che la vera innovazione significa aprire non solo il nostro codice, ma anche le nostre menti.

