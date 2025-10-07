La IA: ¿prometedora o inútil para el lenguaje de signos?

Apertus, el modelo suizo de inteligencia artificial, puede trabajar en 1.500 idiomas. El lenguaje de signos, sin embargo, se ha quedado fuera en gran medida. Los laboratorios y las empresas emergentes de Suiza están trabajando para cambiar esta situación, pero se enfrentan a muchos retos.

«Para las personas que utilizan la lengua de signos, los idiomas hablados y escritos suelen ser idiomas extranjeros», afirma Sarah Ebling, profesora de Lenguaje, Tecnología y Accesibilidad en la Universidad de Zúrich. Las herramientas de conversión de voz a texto, que transcriben instantáneamente el lenguaje hablado, son una solución común pero, para la comunidad sorda, imperfecta. Y es que las lenguas de signos no son simplemente una forma diferente de expresar el lenguaje hablado, sino que, a menudo, no tienen una forma escrita.

Para permitir la comunicación en tiempo real entre el lenguaje de signos y el lenguaje hablado, un software tendría que interpretar. Y la naturaleza visual del lenguaje de signos dificulta esta tarea. Las personas que se dedican a interpretar pueden hacerlo rápidamente, pero una solución informática requiere un conjunto de funciones complejo: transcribir, traducir a otro idioma y, después, generar un vídeo para producir una imagen de una persona haciendo señas. Para hacerlo de forma rápida y a gran escala, los desarrolladores están buscando cómo combinar las soluciones de IA que ya hay para crear un software de interpretación de lengua de signos en tiempo real.

Algunos problemas: errores, expresión y velocidad

Una de las herramientas más prometedoras para el uso diario es SignGemma de Google, anunciada en mayo de 2025 y que se espera que esté disponible para finales de este año.

La empresa sign.mt, con sede en Zúrich, ya ha lanzado una demo capaz de hacer traducciones básicas de texto a más de 40 lenguas de signos, incluido el suizo-alemán.

En estas primeras etapas, sin embargo, las herramientas no están listas para usarlas de manera generalizada. Los servicios de traducción, como sign.mt, cometen muchos errores, los vídeos generados de quienes interpretan todavía no son tan expresivos como los de una persona y no se producen con la suficiente rapidez para permitir una comunicación fluida.

«Seguimos estos avances con interés, pero también con ojo crítico. La calidad debe ser alta, de lo contrario estas herramientas no serán tan accesibles ni utilizables en la vida real. En este momento, no conocemos ningún producto que satisfaga nuestras expectativas», admite Ben Jud, portavoz de la Asociación Suiza de Personas Sordas (SGB-FSS).

Los retos de los dialectos suizos

A la complejidad hay que añadir el hecho de que la lengua de signos no es una única lengua. Existen docenas de versiones en todo el mundo. En Suiza, hoy en día unas 30.000 personas utilizan tres lenguas de signos diferentes.

Las lenguas de signos —igual que las lenguas habladas del país— varían de una región a otra. Mientras que las lenguas de signos suizo-francesa y suizo-italiana son similares a las de los países vecinos, la lengua de signos suizo-alemana es significativamente diferente de su homóloga alemana. Es mucho más difícil recopilar suficientes datos de las lenguas menos extendidas, como la lengua de signos suizo-alemana, que de las lenguas de signos más utilizadas.

Iniciativas públicas y privadas en marcha

SwissTXT es una división de la Sociedad Suiza de Radiodifusión (empresa matriz de Swissinfo) especializada en accesibilidad. Pretende utilizar la lengua de signos mediante IA para hacer que la mayoría de sus programas de televisión sean accesibles a las personas que utilizan el idioma de signos. En la división actualmente hay 14 personas dedicadas a la lengua de signos en tres idiomas. Una cantidad que no es suficiente para proporcionar interpretación en todos los programas.

«El uso de intérpretes digitales tiene su justificación cuando no hay intérpretes humanos disponibles», reconoce Ebling.

El siguiente vídeo muestra avatares presentando en lengua de signos la previsión meteorológica para el oeste de Suiza:

Para empezar a desarrollar intérpretes de IA, SwissTXT grabó con 16 cámaras a intérpretes y capturó cada gesto. Estas imágenes se han utilizado para generar signos digitales. Se espera que a principios de 2026 se realice la primera prueba de la herramienta en directo en informes meteorológicos y programas rutinarios similares.

«Nos centramos en contenidos con una estructura que se repite de forma similar todos los días», apunta Louis Amara, director de innovación de SwissTXT.

Actualmente queda fuera del alcance de las capacidades del software la interpretación de signos mediante IA para otros programas de televisión y películas. Este sistema no tiene capacidad para generar vídeos coherentes y precisos a partir de frases habladas cotidianas, como las de las películas, donde el lenguaje cambia constantemente y, a menudo, es sintácticamente complejo.

En el caso de las herramientas multifuncionales como sign.mt, el proceso de desarrollo hasta ahora ha sido muy similar al proceso de creación de los primeros traductores de texto.

De los métodos estadísticos a los neuronales de traducción

Existen dos niveles de traducción automática, según Amit Moryossef, fundador de sign.mt y antiguo investigador del laboratorio de Sarah Ebling. El primero —el que sign.mt utiliza actualmente— es la traducción automática estadística, que asocia cada palabra hablada a un gesto diferente en lengua de signos. Esto puede dar lugar a errores de traducción basados en el contexto: puede confundir, por ejemplo, un banco en el que sentarse en un parque o un banco en el que se guarda el dinero. Este tipo de confusiones también eran un problema en los primeros traductores de texto, como las primeras versiones de Google Translate. Además, el orden de las palabras y los signos no suele ser el mismo; su sintaxis puede ser muy diferente.

«Lo ideal sería pasar a la siguiente etapa, que es la traducción automática neuronal», dice Moryossef. Se trata de un método más sofisticado en el que la máquina examina toda la frase en su contexto.

La traducción neuronal para la lengua de signos, sin embargo, está fuera del alcance de las herramientas que existen hoy en día. Para desarrollar la base de datos de contextos adecuada, quienes se dedican a desarrollar las herramientas deben ver los vídeos de lengua de signos y anotar cada signo con un alfabeto especial independiente de su significado, similar al alfabeto fonético. Una vez que haya datos suficientes, la máquina aprenderá a asociar signos, o grupos de signos, a grupos de palabras. Esto significa que podrían interpretarse con claridad los modismos o frases hechas, los homófonos (palabras que suenan igual, aunque signifiquen cosas totalmente diferentes) y la jerga.

Otro reto más es la apariencia de los avatares digitales que interpretan el lenguaje de signos. «Si son demasiado realistas, la gente se siente incómoda. Si son demasiado animados, es posible que no se les tome en serio», afirma Louis Amara, de SwissTXT. Para resolver este dilema, SwissTXT está trabajando con la comunidad proponiendo dos apariencias diferentes y recabando sus opiniones.

¿Un papel limitado para la IA?

Zheng Xuan, profesora sorda de la Facultad de Educación de la Universidad Normal de Pekín, en China, recientemente ha escritoEnlace externo que «la preocupante calidad del lenguaje de signos generado por la IA infringe directamente el derecho de las personas sordas a acceder a la información, contamina el corpus del lenguaje de signos y obstaculiza la promoción y popularización del lenguaje de signos auténtico entre la comunidad sorda».

Zheng Xuan ha llegado a esta conclusión tras una investigación en China que ha demostrado que las personas sordas tienen dificultades para comprender los movimientos de los avatares de lengua de signos generados por IA y consideran que tienen un vocabulario limitado.

A la luz de estos retos, la asociación profesional de intérpretes y traductores de lengua de signos de la Suiza de habla alemana (bgdü) señala que «no les preocupa su profesión» ante la posible competencia de los sistemas basados en IA. Estos sistemas son, todavía, incapaces de percibir y transmitir elementos interpersonales como el énfasis, la entonación, los matices y el lenguaje corporal de la persona que habla o que interpreta a través de signos. Elementos fundamentales para una comunicación humana satisfactoria.

«Los avatares y los intérpretes digitales pueden ser complementos útiles en algunas áreas, si las personas sordas así lo desean, pero seguirá existiendo la demanda de traductores e intérpretes humanos», concluye en una nota la junta directiva de la bgdü.

SwissTXT coincide en esto. «La IA se utilizará solo en espectáculos en los que no pueda disponerse de una persona intérprete. De este modo, amplía el servicio más allá de lo que podríamos ofrecer solo con personas», afirma Peter Klinger, coordinador sénior de proyectos de SwissTXT.

Nadie está dispuesto a sustituir a las personas en otras situaciones, como en consultas médicas o tribunales. «En entornos médicos, esta tecnología es totalmente inviable porque el factor humano es muy importante y hay muchas cosas que pueden salir mal», indica Ebling.

Editado por Gabe Bullard. Adaptado del inglés por Lupe Calvo. Revisado por Carla Wolff.

El vídeo de los avatares comunicando en lengua de signos se actualizó el 9 de octubre de 2025.

