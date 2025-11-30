Verdadeiro ou falso? Fatos e mitos sobre o Apertus, o modelo suíço de IA

Desde o seu lançamento no início de setembro, muito se tem falado e escrito sobre o modelo suíço de IA Apertus. O que é verdade e o que é falso? Keystone / Gaetan Bally

As escolas politécnicas, as universidades mais prestigiosas do país, lançaram recentemente o Apertus, um novo modelo de IA em grande escala. As reações foram variadas – em parte calorosas, mas também críticas. Analisamos o que está por trás das afirmações mais frequentes sobre essa nova tecnologia.

Após semanas de expectativa, a Escola Politécnica Federal de Zurique (ETH) e a de Lausanne (EPFL) apresentaram o Apertus, um modelo nacional de linguagem em grande escala (LLM). Os desenvolvedores o descrevem como “totalmente aberto” – o que significa que todas as partes do modelo estão disponíveis ao público – e “um marco na IA generativa em termos de transparência e diversidade”. Várias afirmações têm circulado sobre o que ele pode ou não fazer. O que é verdadeiro e o que é falso nesse contexto?

A Swissinfo testou o Apertus e ouviu seus desenvolvedores, além de outros especialistas em IA, para separar fatos de ficção e esclarecer seus principais pontos fortes e fracos.

“O Apertus é o ChatGPT da Suíça”: falso

O Apertus não foi projetado para uso pessoal, como o ChatGPT da OpenAI. Ele é um modelo básico de IA desenvolvido para ser adaptado a diferentes aplicações e serviços, especialmente em negócios e pesquisa. Pode, por exemplo, ser usado para impulsionar o e-commerce ou extrair informações multilíngues na área médica.

“O público em geral não é nosso principal público-alvo”, afirma Imanol Schlag, pesquisador da ETH responsável pelo desenvolvimento técnico do Apertus.

Por essa razão, o modelo não foi lançado com funcionalidades voltadas ao usuário final nem com um aplicativo móvel específico.

“Nossa intenção nunca foi desenvolver uma resposta suíça ao ChatGPT”, explica Maria Grazia Giuffreda, diretora-associada do Centro Suíço de Computação Científica em Lugano, onde está localizado o supercomputador que opera o Apertus.

Para dar ao público a oportunidade de experimentar a nova IA, a ONG Public AI disponibilizou algumas funções de chat em seu siteLink externo.

“O Apertus não consegue competir com os LLMs mais utilizados”: verdadeiro

O Apertus é o LLM totalmente aberto mais poderoso que existe, com 70 bilhões de parâmetros (indicadores de capacidade de aprendizado) em sua maior versão. Ainda assim, ele não se compara a modelos fechados como o GPT-4, o Gemini ou o Claude, que são treinados com conjuntos de dados muito maiores e contam com poder computacional significativamente superior. Para efeito de comparação, o GPT-3 tem 175 bilhões de parâmetros (os detalhes das versões posteriores não são públicos).

“Comparar o Apertus com modelos de IA de grandes empresas norte-americanas é como comparar um pequeno agricultor em Valais com um produtor de carne bovina em larga escala”, afirma El Mahdi El Mhamdi, professor da Escola Politécnica de Paris.

No entanto, modelos menores podem ser mais eficientes, acessíveis a pequenas e médias empresas e mais econômicos em termos energéticos. “Há uma crescente conscientização de que a qualidade dos dados é mais importante do que a quantidade”, acrescenta Mete Ismayilzada, pesquisador da EPFL e da Universidade da Suíça Italiana.

Alguns especialistas manifestam ceticismo. Bruno Frey, professor emérito da Universidade de Zurique, afirma que o LLM suíço indicou uma fonte científica incorreta: “Não achei muito convincente”, relata. O matemático Xavier Comtesse escreveuLink externo no LinkedIn que o modelo gera muitos resultados aparentemente precisos, mas que, na verdade, estão errados (as chamadas alucinações).

Schlag defende o desempenho do Apertus, observando que sua versão menor (com 8 bilhões de parâmetros) já supera modelos comparáveis da Mistral, da Meta, da Alibaba e de qualquer outra instituição pública.

“O Apertus é ético e transparente em comparação com outros modelos de IA”: verdadeiro

O Apertus é o primeiro modelo de IA em grande escala projetado e desenvolvido para atender aos principais requisitos da Lei Europeia de IA, que entrou em vigor em 2024. Esses requisitos incluem transparência, rastreabilidade dos dados e respeito à propriedade intelectual e à privacidade. A arquitetura do modelo, seus pesos (valores numéricos que definem como as redes neurais funcionam) e as instruções de treinamento são públicos. Os conjuntos de dados usados no treinamento vêm de fontes públicas e legais e não incluem obras protegidas por direitos autorais nem sites que optaram por não participar de conjuntos de dados de IA.

Em contraste, as gigantes da tecnologia exploram há anos dados de bilhões de usuários sem consentimento, incluindo conteúdo protegido por direitos autorais. Esses dados são frequentemente compilados por trabalhadores humanos ocultos e mal remuneradosLink externo em países em desenvolvimento, observa El Mhamdi. “Ainda não percebemos o nível de abuso que está sendo normalizado na cadeia de suprimentos da IA moderna”, afirma.

Essa é a razão pela qual o Apertus é particularmente atraente para empresas, instituições de pesquisa e órgãos públicos que desejam desenvolver aplicações de IA de forma ética e em conformidade com a lei. “Somos um exemplo de que é possível treinar IA generativa de maneira responsável e sem violar a propriedade intelectual de outras pessoas”, diz Schlag.

“O Apertus fala mais de 1.800 idiomas”: enganoso

Os desenvolvedores fizeram um grande esforço para treinar o Apertus em uma ampla variedade de idiomas — mais de 1.800, segundo eles, incluindo línguas minoritárias e dialetos frequentemente ignorados por LLMs populares, como o romanche e o suíço-alemão. Isso é significativo, pois a maioria dos modelos de IA se concentra em idiomas amplamente falados.

Compreender uma língua é uma coisa; usá-la corretamente é outra. Em especial nas línguas menos comuns, o Apertus ainda comete erros evidentes.

Em nossos testes, por exemplo, o modelo às vezes produziu frases estranhas ou incorretas em italiano e apresentou uma tradução equivocada para a palavra “avô” em romanche.

Imanol Schlag admite que as habilidades de conversação do modelo precisam ser aprimoradas, mas ressalta que ele já supera outros em determinadas tarefas, por exemplo, na tradução do alemão para o romanche, segundo o último relatórioLink externo técnico.

Nem todos se impressionam. “Qual é o sentido de um modelo que fala romanche se seu desempenho médio está muito abaixo do de modelos comparáveis, sem falar nos mais avançados?”, questiona Aldo Podestà, diretor-executivo da startup suíça de IA Giotto.ai, que apoia o projeto Apertus, mas reconhece suas limitações.

Já Mary-Anne Hartley, professora e diretora do Laboratório da EPFL de Tecnologias Inteligentes para a Saúde Global e Resposta Humanitária, discorda: “As pessoas que falam idiomas pouco difundidos merecem estar representadas na tecnologia. É isso que o Apertus busca fazer.” Para os desenvolvedores, essas falhas iniciais são o preço temporário de uma abordagem mais inclusiva e ética.

“O Apertus foi pensado apenas para a Suíça”: falso

Embora tenha sido desenvolvido na Suíça por instituições suíças, seria incorreto considerar o Apertus útil apenas para aplicações locais. A maioria dos conjuntos de dados de treinamento vem de fontes internacionais. As exceções incluem dados em suíço-alemão e romanche, além da integração de uma “carta de valores suíços” que estabelece princípios como neutralidade e diversidade linguística, aos quais a IA deve se alinhar. “Fora desses aspectos, nosso modelo não tem nada de especificamente suíço”, afirma Schlag.

A equipe do Apertus espera que outros países se interessem pelo projeto e contribuam com infraestrutura, talentos e recursos. “Nossa ambição é continuar desenvolvendo o Apertus em nível europeu — se não global”, afirma Giuffreda, do Centro Suíço de Computação Científica de Lugano.

“O Apertus não consegue se atualizar em tempo real porque não está conectado à internet”: enganoso

Nenhum modelo de linguagem de grande porte consegue se atualizar em tempo real. Todos permanecem estáticos após o treinamento, mesmo quando incorporados em produtos com acesso à internet, como o ChatGPT. A única forma de inserir alterações e correções em um modelo de IA é por meio de um novo treinamento — um processo caro, que apenas empresas com grandes recursos podem realizar com frequência. “Essa é a principal limitação da tecnologia”, explica Schlag.

Para a próxima rodada de treinamento, o Apertus contará com 20 milhões de francos suíços de financiamento federal e com o supercomputador Swiss Alps, alimentado integralmente por energia hidrelétrica — o que reduz o impacto ambiental. A longo prazo, porém, serão necessárias novas fontes de financiamento. “Gostaria de ver mais investimentos nessa tecnologia, que é crucial para nossa soberania digital”, conclui Schlag.

Edição: Gabe Bullard/ts

Adaptação: Soraia Vilela

