Entendiendo ChatGPT: funcionamiento, componentes clave y retos actuales de los modelos de lenguaje a gran escala

Antonio Miguel Artiaga, profesor de la Escuela de Ingeniería y Arquitectura de la Universidad de Zaragoza e investigador del I3A, fue el protagonista del último Ateneo de la EINA de este curso académico

“Nunca dejaría la gestión de mi correo electrónico a ChatGPT”, es uno de los ejemplos que pone Antonio Miguel Artiaga para explicar qué es ChatGPT y cómo puede ser una herramienta tecnológica válida si se hace un uso adecuado, “debe ser una ayuda, un apoyo, una inspiración”, nunca será útil si tiene información incompleta o falsa.

El último Ateneo de la EINA de este curso académico estuvo dedicado ayer a los Modelos de Lenguaje a Gran Escala y a las diferentes versiones de ChatGPT con el profesor de la EINA e investigador del I3A Unizar, Antonio Miguel Artiaga.

En su conferencia se acercó al mundo de los Modelos de Lenguaje a Gran Escala, explorando su funcionamiento, componentes principales y el origen de su versatilidad. “Algunas de estas claves pasan por entender que pueden ser capaces de generar representaciones de la información, modelos del mundo y secuencias de cálculos de forma autónoma”, explicó Antonio Miguel.

En su charla, expuso algunos ejemplos de casos de uso con resultados positivos y negativos y abordó la evolución y las controversias que han rodeado a modelos como GPT-3 y sus sucesores (ChatGPT 3.5, 4…). Además, se refirió a “la explosión de aplicaciones” que han surgido en unos pocos meses identificando los actores clave y los nuevos desarrollos de código abierto.

Esa explosión del ecosistema de Modelos de Lenguaje a Gran Escala “ha dado un salto muy grande en cuatro años y de ahí la alarma que ha generado”, recordó el profesor Miguel Artiaga. En ese tiempo, “hemos replanteado el concepto de complejidad”, se ha pasado de considerar complicado extraer entidades de un texto o deshacer ambigüedades a estar haciendo resúmenes y respondiendo preguntas. Según explicó el investigador, “estos modelos nos asustan por cómo representan la información, de una manera más cercana a la nuestra”.

El debate también gira en torno a la necesidad de regulación. La Unión Europea trabaja ya para crear una normativa en la que se contemplan sanciones, pero, por ejemplo, Japón ha declarado que todo el copyright no aplica a modelos de aprendizaje. Mientras tanto, empresas y entidades apuestan por el software libre y reconocen haber utilizado desarrollos recientes como llama.cpp en su flujo de trabajo, según explicó Antonio Miguel en su participación en el Ateneo.

Antonio Miguel Artiaga es ingeniero de Telecomunicación y doctor por la Universidad de Zaragoza. Es profesor en el Departamento de Ingeniería Electrónica y Comunicaciones de la Escuela de Ingeniería y Arquitectura. Actualmente, imparte tres asignaturas relacionadas con el aprendizaje automático y deep learning (redes neuronales profundas) en dos titulaciones de máster.

Forma parte del grupo de investigación ViVoLab del I3A, en sus líneas de trabajo combina su participación en diversos proyectos de financiación pública y desarrollos de transferencia con empresas tanto locales como internacionales y colaboraciones con otros grupos de investigación. Sus áreas de investigación actuales incluyen aplicaciones en el campo del procesado de señal, especialmente en el procesado de señales de voz, reconocimiento de voz, reconocimiento de hablantes, además del procesado de lenguaje natural (modelos de lenguaje, traducción…) y generación de representaciones multimedia. Todo ello utilizando modelos tanto estadísticos como redes neuronales profundas y transformers.

La sesión estuvo moderada por Eduardo Lleida, catedrático de la Universidad de Zaragoza y responsable del grupo de investigación del I3A, ViVoLab.

Asistieron a esta última sesión del curso académico 2023-24, el director de la EINA, José Antonio Yagüe, y el director de la Cátedra SAMCA de Desarrollo Tecnológico y del I3A, Pablo Laguna.

Fotografías: Alfredo Soria (EINA)