The Swiss voice in the world since 1935

Preconceito não está apenas nos algoritmos, mas também nas palavras que escolhemos

Claudia Vaccarone

O lançamento do modelo Apertus, da Suíça, destaca como até mesmo uma terminação latina pode carregar séculos de peso cultural, argumenta a especialista em comunicação inclusiva Claudia Vaccarone.

A Suíça acaba de dar um passo ousado em direção à inteligência artificial. As escolas politécnicas federais EPFL e ETH de Zurique, juntamente com o Centro Nacional Suíço de Supercomputação (CSCS), lançaram o ApertusLink externo, o primeiro modelo de linguagem multilíngue, de código aberto e em larga escala do país.

O modelo é verdadeiramente único por ser multilíngue por natureza: o Apertus foi treinado com 15 trilhões de tokens (palavras ou partes de palavras) de mais de mil idiomas – entre os cerca de sete mil falados atualmente no mundo. Com aproximadamente 40% das fontes em outros idiomas, o modelo incorpora línguas geralmente sub-representadas em LLMs, como o suíço-alemão, o romanche e muitas outras.

Do ponto de vista da diversidade cultural, esse é um detalhe fundamental, já que a grande maioria dos principais LLMs ainda é treinada predominantemente em inglês. Isso ocorre porque a internet possui muito mais conteúdo nesse idioma do que em qualquer outro, e porque as maiores empresas de IA estão sediadas nos EUA e no Reino Unido, produzindo principalmente para mercados de língua inglesa.

Na geração atual desses serviços, isso traz consequências. O estudo de 2023 “Lost in Translation”Link externo, do Centro para Democracia e TecnologiaLink externo, afirma que modelos treinados majoritariamente em textos em inglês “acabam transferindo valores e suposições codificados em inglês para outros contextos linguísticos aos quais eles podem não pertencer. Por exemplo, um modelo multilíngue pode associar a palavra ‘pomba’ em todos os idiomas com ‘paz’, embora a palavra basca para pomba (uso) possa ser um insulto.”

Ao utilizar ferramentas baseadas em LLM em línguas com poucos recursos, podem surgir mais alucinações e vieses. Há um risco claro de homogeneização linguística se idiomas menores não forem deliberadamente incluídos. É por isso que projetos como o BLOOMLink externo e o Apertus, concebidos explicitamente para priorizar a diversidade linguística, são tão importantes.

Gramática latina e preconceito moderno

Apertus é uma palavra em latim que significa “aberto” – em teoria, um nome perfeito para uma ferramenta que promete transparência radical. Diferentemente da maioria dos modelos comerciais de IA, o código, os dados e a metodologia do Apertus são totalmente acessíveis.

O uso do latim também confere ao nome um caráter acadêmico e atemporal, apropriado para um modelo desenvolvido por instituições suíças de prestígio como a EPFL, a ETH e o CSCS. Ele transmite a ideia de soberania digital e de uma IA acessível.

No entanto, há algo intrínseco ao nome que merece atenção – especialmente se realmente levamos a sério a ideia de abertura.

Em latim, substantivos e adjetivos têm terminações diferentes conforme o gênero: aperta é feminino; apertum é neutro; apertus é masculino.

O LLM suíço utiliza a forma masculina. Os dicionários podem listá-la como “padrão”, mas essa escolha não é neutra. Ela reflete uma convenção de longa data nas línguas europeias que trata o masculino como universal – uma convenção tão arraigada que muitas vezes passa despercebida. Isso contribuiu para tornar o feminino invisível (pense em profissões conhecidas apenas na forma masculina) e para cristalizar uma hierarquia patriarcal entre os sexos.

Pesquisas sociolinguísticasLink externo recentes e robustas demonstram que o cérebro humano não lida bem com a ambiguidade do masculino universal – e o interpreta literalmente.

Movimentos de linguagem inclusiva têm buscado justamente evidenciar a necessidade de desmontar o uso universal das formas masculinas, favorecendo construções neutras em termos de gênero.

Por que a escolha de Apertus é importante

Escolher Apertus em vez de Aperta ou Apertum não é um erro em si.

Infelizmente, porém, é um reflexo de como a própria linguagem codifica hierarquias de gênero – especialmente no meio científico -, apresentando o masculino como norma e tudo o mais como desvio. Trata-se de um hábito linguístico mais amplo, que naturaliza o masculino como padrão “neutro”. Esse hábito, em si, é uma forma de preconceito estrutural que perpetua a invisibilidade do feminino.

Foi uma oportunidade perdida de estender a inclusão de gênero à marca dessa ferramenta de IA inovadora e linguisticamente diversa – e de reconhecer o impacto e o poder simbólico da linguagem.

Pode-se argumentar que a escolha da forma masculina em Apertus se alinha ao gênero gramatical da palavra “modelo” em algumas línguas (por exemplo, le modèle em francês, il modello em italiano, das Modell em alemão). Mas, como classicista europeia multilíngue, vejo nessa escolha mais do que uma questão gramatical: vejo um padrão de decisões linguísticas que refletem um viés social.

Seria interessante saber mais sobre o processo criativo que levou à escolha desse nome. O processo de ideação foi totalmente humano ou contou com sugestões de algum dos LLMs existentes? O Apertus, por acaso, escolheu o próprio nome?

Por curiosidade, perguntei a dois LLMs – ChatGPT e Gemini – o que achavam do nome. Ambos elogiaram a elegância e a clareza de propósito da palavra latina. Mas, quando questionados sobre as implicações de gênero, suas respostas divergiram. O ChatGPT reconheceu o viés como “sutil e sistêmico”. Já o Gemini, inicialmente, descartou a questão como irrelevante, argumentando que “Apertus é um nome, não uma pessoa” e que “a maioria das pessoas não sabe latim”. Só após insistência admitiu que a forma masculina poderia, sim, reforçar normas de exclusão.

O mundo da tecnologia tem um histórico bem documentado de desequilíbrio de gênero. Um nome como Apertus reforça sutilmente a ideia de que a tecnologia é um domínio masculino. É um sinal pequeno, mas que faz parte de um padrão maior. Cada vez que um novo produto ou projeto adota um nome masculino, contribui para a narrativa de que os homens são os principais criadores e usuários desse campo.

Uma abordagem neutra e baseada em direitos humanos

Se o modelo tivesse sido nomeado com uma abordagem neutra em termos de gênero e inspirada em direitos humanos, o nome poderia ter ressoado de outra forma. Aperta poderia transmitir abertura de modo acolhedor, inclusivo e humano, enquanto Apertum enfatizaria neutralidade e abstração – ecoando, inclusive, a tradição suíça de neutralidade.

Um dos maiores riscos em torno da tecnologia e da IA é que elas reproduzam as desigualdades das sociedades e organizações que as criam. Mas o preconceito não está apenas nos algoritmos ou nos conjuntos de dados – ele reside na própria linguagem.

Reconhecer essa realidade e refletir intencionalmente sobre o uso das palavras oferece uma oportunidade única de trilhar um caminho diferente. Dessa forma, o Apertus pode se tornar mais do que uma ferramenta: pode servir como uma lente através da qual examinamos os padrões de nossa sociedade.

Afinal, abertura não diz respeito apenas à transparência. Trata-se também da coragem de questionar as normas que fazem metade da população se sentir invisível. A Suíça tem a chance de mostrar que a verdadeira inovação significa abrir não apenas o código, mas também as nossas mentes.

Adaptação: DvSperling

Mais lidos

Os mais discutidos

Certificação JTI para a SWI swissinfo.ch

Mostrar mais: Certificação JTI para a SWI swissinfo.ch

Veja aqui uma visão geral dos debates em curso com os nossos jornalistas. Junte-se a nós!

Se quiser iniciar uma conversa sobre um tema abordado neste artigo ou se quiser comunicar erros factuais, envie-nos um e-mail para portuguese@swissinfo.ch.

SWI swissinfo.ch - sucursal da sociedade suíça de radiodifusão SRG SSR

SWI swissinfo.ch - sucursal da sociedade suíça de radiodifusão SRG SSR