Redacción Ciencia, 12 nov (EFE).- AlphaProof es un sistema de inteligencia artificial capaz de demostrar teorías matemáticas complejas y cuyo rendimiento le valdría la medalla de plata en la Olimpiada Internacional de Matemáticas (IMO) del año pasado.

Esta herramienta de inteligencia artificial (IA) creada por Google DeepMind fue presentada en 2024 y ahora sus responsables publican en Nature los detalles.

Hasta ahora se han logrado grandes avances en la creación de sistemas de IA que ayudan a los matemáticos a descubrir nuevos conocimientos, algoritmos novedosos y respuestas a problemas abiertos.

Sin embargo, siguen teniendo dificultades para resolver problemas matemáticos generales debido a las limitaciones de sus capacidades de razonamiento y de los datos de entrenamiento, según destacó DeepMind el año pasado cuando presentó AlphaProof.

Además, aunque algunos modelos lingüísticos de gran tamaño han demostrado capacidades prometedoras, ha sido difícil verificar la corrección de su razonamiento, explica Nature.

Aprendizaje por refuerzo

AlphaProof, que se basa en el aprendizaje por refuerzo, fue entrenado para generar pruebas cuyos razonamientos pueden ser verificados por un asistente de demostración llamado Lean, el cual incluye una gran biblioteca de teoremas y demostraciones

El nuevo sistema de IA se entrena a sí mismo y combina un modelo de lenguaje preentrenado con el algoritmo de aprendizaje por refuerzo de AlphaZero, herramienta esta última que aprendió por sí misma a jugar al ajedrez o al Go.

Esto significa que trata las demostraciones matemáticas como un juego, “utilizando herramientas especializadas llamadas asistentes de demostración, que los matemáticos usan para escribir demostraciones que un ordenador puede comprobar automáticamente”, explicó, en un artículo que analiza y acompaña al estudio, Talia Ringer de la Universidad de Illinois (EE.UU.), quien no participó en la investigación.

AlphaProof mejora los resultados de los sistemas de IA más avanzados hasta la fecha en problemas históricos de competiciones matemáticas, indica el estudio, encabezado por Eric Wieser de Google DeepMind.

Esta herramienta, combinada con un sistema de resolución de geometría llamado AlphaGeometry2, fue capaz de resolver cuatro de los seis problemas planteados en la IMO del año pasado.

Medalla de plata

“Alcanzó una puntuación equivalente a la de un medallista de plata, lo que supuso la primera vez que un sistema de IA alcanzaba un rendimiento digno de medalla”, dice el estudio.

Aunque AlphaProof ha demostrado un rendimiento impresionante en el ámbito del razonamiento matemático a nivel de competición, los autores señalan algunas limitaciones a la hora de resolver otros tipos de problemas difíciles, lo que sugieren como vías para futuras investigaciones.

Abordar estas limitaciones allanará el camino para que AlphaProof se convierta -escriben los autores- “en un colaborador cada vez más valioso para los investigadores humanos en la exploración de las fronteras de las matemáticas y, por extensión, de otras disciplinas científicas”.

Los expertos opinan

AlphaProof “parece un sistema potente” y supone un avance conceptual fundamental: demuestra que los modelos de razonamiento pueden alcanzar la verificación formal, eliminando el riesgo de alucinaciones factuales que afecta a otros sistema de IA”, según Carles Sierra, director del Instituto de Investigación en Inteligencia Artificial del CSIC.

Sierra, que no participó en el estudio, dijo a la plataforma de recursos científicos Science Media Centre que el artículo no describe con excesivo detalle el sistema, sino los resultados de la olimpiada.

Aun destacando que se trata de un resultado “excelente”, el informático Ramón López de Mántaras, subrayó que hasta ahora los éxitos del sistema se han dado principalmente en matemáticas de nivel avanzado de secundaria y pregrado, que operan dentro de un conjunto conocido y relativamente fijo de conceptos.

Sin embargo, extender estas capacidades a la investigación matemática avanzada, que implica la creación de teoría y la incorporación de nuevos conceptos, “sigue siendo un desafío monumental y no hay indicios” de que pueda lograrse a corto o medio plazo.

Estos logros, agregó, “no significan que la IA sea comparable a un matemático, ya que no ‘entiende’ en absoluto los conceptos matemáticos ni puede crear soluciones para problemas completamente nuevos”. EFE

