Entre sombras y neuronas

Alberto Requena

28 junio 2024

1.294

Podríamos subtitular este texto como “descifrando el enigma de la inteligencia artificial”. En el corazón de la revolución tecnológica actual yace un enigma que tanto fascina como desafía a los científicos e investigadores de todo el mundo: la inteligencia artificial (IA) y, más específicamente, las redes neuronales. Estas estructuras computacionales, inspiradas en el funcionamiento del cerebro humano, han demostrado capacidades sorprendentes en áreas que van desde el reconocimiento de voz y de imágenes hasta la predicción de patrones complejos en datos financieros. Sin embargo, a pesar de sus impresionantes logros, un velo de misterio envuelve el núcleo de su funcionamiento, provocando tanto asombro como preocupación en la comunidad científica. Es mucha la confusión y los desafíos que enfrentan los investigadores debido a la opacidad de las redes neuronales, al tiempo que subraya la importancia de avanzar hacia una comprensión más profunda de estas poderosas herramientas.

Las redes neuronales, particularmente las profundas (deep learning), operan mediante la creación de capas de nodos o "neuronas" que procesan los datos de entrada, aprendiendo patrones complejos a través de enormes conjuntos de ejemplos. Esta capacidad para aprender y adaptarse sin ser explícitamente programadas para tareas específicas es lo que las hace tan poderosas. Sin embargo, también es la fuente de una profunda incertidumbre: a medida que las capas se vuelven más profundas y los modelos más complejos, la capacidad de los investigadores para interpretar cómo se toman las decisiones dentro de estas "cajas negras" disminuye significativamente.

La preocupación principal es doble: por un lado, la dificultad para explicar el razonamiento tras las decisiones de la IA plantea interrogantes éticos, especialmente en aplicaciones críticas como la medicina, la justicia y la seguridad. Por otro lado, esta opacidad limita la capacidad de los investigadores para mejorar, depurar y, en última instancia, confiar en los sistemas de IA.

La comunidad científica ha respondido a este desafío con una creciente investigación en el campo de la IA explicable, que busca desarrollar métodos y técnicas para hacer que el proceso de toma de decisiones de las redes neuronales sea más transparente y comprensible para los humanos. Esta línea de investigación no solo es crucial para mitigar los riesgos éticos y prácticos asociados con la IA, sino también para permitir una colaboración más efectiva entre humanos y máquinas, aprovechando las fortalezas de ambos.

La senda hacia una IA verdaderamente explicable es compleja y llena de desafíos técnicos. Sin embargo, la necesidad de avanzar en este camino es clara. Al desarrollar herramientas y metodologías que nos permitan "mirar dentro" de las redes neuronales, podemos asegurarnos de que la IA se desarrolle de una manera que sea ética, segura y alineada con los valores humanos. Además, entender más profundamente cómo las máquinas aprenden y toman decisiones puede inspirar nuevas líneas de investigación en neurociencia y psicología, cerrando el círculo entre la inteligencia artificial y la inteligencia natural.

Describimos algo más que un desafío técnico; es una llamada a garantizar que los avances en IA se realicen de manera responsable y transparente. A medida que estas tecnologías continúan integrándose en todos los aspectos de nuestra vida, es imperativo que desarrollemos no solo máquinas que puedan aprender y pensar, sino que también podamos entender y confiar en cómo lo hacen. En este esfuerzo, la colaboración multidisciplinaria será clave, uniendo a informáticos, filósofos, éticos y psicólogos en la búsqueda común de una inteligencia artificial que, aunque creada por humanos, pueda ser comprendida por ellos.

Imagen creada con ayuda de Chat GPT con DALL_E.

La llamada no es un clamor infundado, dado que ni siquiera los investigadores que los construyen comprenden cómo funcionan en su totalidad. Los grandes modelos de lenguaje, las estrategias generativas, como es el caso de Chat GPT, las denominamos Inteligencia Artificial, aunque no forman parte de la Inteligencia Artificial General que es la denominación reservada para los sistemas automáticos que emulen al funcionamiento de la Inteligencia humana. En la actual Inteligencia artificial funcionan las estructuras denominadas redes neuronales. Están basadas en una reinterpretación de un área que no tiene nada que ver con la neurociencia, cual es la molecular que permite interpretar las interacciones magnéticas entre los núcleos, que están tras la bien conocida resonancia magnética nuclear. Determinar la acción magnética total, consecuencia de que, un sinnúmero de átomos, contribuyen a ella y consiste en estimar las interacciones entre ellos, contiguos, lejanos, iguales, diferentes, apantallados más o menos por los demás, etc. Se determina una suma de las acciones ponderados los términos por unos coeficientes consecuencia de la concreción de los factores antes señalados. Si cambiamos átomos por neuronas y mantenemos la idea de la interacción entre ellas, podríamos pensar en mantener factores como la distancia que las separa o lo que resulta más práctico que es dejar la determinación de esos factores de ponderación a que se ajusten para dar el resultado buscado. Acabamos de describir el entrenamiento de una red neuronal. Partiendo de los elementos que estimamos que son determinantes para el proceso que estudiamos, ajustamos los factores de ponderación para que produzcan un resultado que conocemos. Si lo hacemos bien, el número de casos es suficiente y la estructura de la red es apropiada, dispondremos de un mecanismo, una vez entrenada, capaz de responder ante unos factores desconocidos. Será un sistema capaz de dar una respuesta apropiada siempre que la apliquemos al ámbito en el que está entrenada.

Ahora bien, la clave radica en que el número de capas y el número de neuronas va creciendo conforme vamos exigiendo mayor precisión. De ahí que nunca está asegurada una respuesta con un 100% de acierto. Por otro lado, la construcción de la red no está bajo el control humano de los programadores, salvo en ciertos límites. Cuando se trata de una red neuronal profunda (DNN) el número de neuronas y capas puede variar enormemente dependiendo de la complejidad de la tarea que se pretende resolver y las limitaciones computacionales disponibles. Las redes neuronales profundas son una subcategoría de las redes neuronales artificiales diseñadas para aprender patrones de datos a través de múltiples capas de procesamiento, donde cada capa aprende a transformar su entrada en un poco más de abstracción que la anterior.

En términos de capas, una DNN típicamente tiene desde unas pocas hasta cientos o incluso miles de capas. Por ejemplo: redes pequeñas, para tareas más simples, una red puede tener tan solo 3 capas (1 capa de entrada, 1 capa oculta y 1 capa de salida); redes medianas. para tareas de complejidad intermedia, como la clasificación de imágenes básicas, que puede tener entre 10 y 100 capas y redes grandes y de vanguardia, como las de reconocimiento de imágenes avanzado, procesamiento del lenguaje natural y generación de texto, que pueden tener desde cientos hasta miles de capas. Un ejemplo famoso es GPT-3 (Generative Pre-trained Transformer 3), que, aunque no es una red neuronal "profunda" en el sentido convencional, tiene 175 mil millones de parámetros.

En cuanto a las neuronas (también conocidas como unidades o nodos), el número puede variar desde unos pocos cientos en redes pequeñas a millones en redes grandes. Por ejemplo, en la capa de entrada el número de neuronas suele coincidir con el tamaño del vector de características de entrada. Para imágenes, esto podría ser el número total de píxeles multiplicado por 3 (para canales de color RGB); en las capas ocultas, el número puede variar ampliamente. Algunas capas pueden tener cientos o miles de neuronas. La elección depende del diseño específico de la red y de las consideraciones de rendimiento y capacidad computacional; en la capa de salida, el número de neuronas suele coincidir con el número de clases en un problema de clasificación o la dimensión de la salida deseada para otras tareas.

La elección de cuántas capas y neuronas incluir en una red neuronal profunda depende de varios factores, incluyendo la complejidad del problema, ya que tareas más complejas requieren redes más profundas y/o más anchas (más neuronas por capa) para capturar adecuadamente las abstracciones necesarias para realizar predicciones precisas. También incide el sobreajuste, dados que las redes más grandes tienen un mayor riesgo de sobreajuste, donde el modelo aprende el ruido en los datos de entrenamiento en lugar de las señales subyacentes. Técnicas como la regularización y el abandono pueden ayudar a mitigar esto. Por supuesto que un factor determinante es la capacidad computacional, dado que las redes más grandes requieren más memoria y poder de cómputo, tanto para el entrenamiento como para la inferencia. En la práctica, el diseño de una red neuronal profunda óptima para una tarea dada suele ser un proceso iterativo que implica experimentación y ajuste fino, buscando el equilibrio adecuado entre capacidad, eficiencia y precisión.

Hace más de medio siglo que hay investigadores sumergidos en éste área. Los trabajos en el interior de las redes, sigue manteniendo misterios. El proceso no es que sea complicado, dado que las salidas de una capa son as entradas de la siguiente capa en jerarquía. Esos factores de interacción, que hemos llamado, son los parámetros de la red que cuantifican el grado o la fuerza de las conexiones entre las neuronas. Las grandes redes tendrán como miles de millones de parámetros. Se parte de valores aleatorios para iniciar el proceso, con lo que las salidas que generan no suelen tener nada que ver con lo esperable. En la fase de entrenamiento es cuando las redes aprenden a producir resultados que pueden ser útiles. Las montañas de datos que sirven de entrenamiento van acompañadas de criterios para evaluar las posibles salidas. Unas entradas producen una salida y se ajustan los parámetros a valores que generarán una mejor salida.

Tanto el proceso de entrenamiento como el comportamiento de las redes neuronales es confuso. Al principio es fácil seguir el proceso, pero la explicación cualitativa en una red grande no está nada claro. No se tiene noción del papel de una neurona a nivel individual. Las Matemáticas del proceso, no están descritas como para conocer con detalle el comportamiento de la red. El papel del número de capas es una incógnita. Conforme aumenta el número de parámetros se mejora la capacidad de predicción y su precisión, aunque esto no se compadece bien con los principios estadísticos que advierten del sobreajuste, al sobrepasar un numero de parámetros determinado y en todo caso se pierde sensibilidad a variaciones pequeñas en los datos de entrada. No se dispone de una teoría capaz de responder a estos extremos. Se sigue intentando aclarar estas cuestiones, pero, de momento, el acierto en la teoría es esquivo. Son luces y sombras, neuronas y sombras lo que subyace a los sistemas de IA que hoy pueblan el pródigo escenario mundial que espera acontecimientos que tranquilicen las actividades, la ética y la conciencia, en último término.

Alberto Requena

Acerca del autor

Este blog pretende ser una depresión entre dos vertientes: la ciencia y la tecnología, con forma inclinada y alargada, para que por la vertiente puedan circular las aguas del conocimiento, como si se tratara de un río; o alojarse los hielos de un glaciar de descubrimiento, mientras tiene lugar la puesta a punto de su aplicación para el bienestar humano. Habrá, así, lugar para la historia de la ciencia, las curiosidades científicas y las audacias científico-tecnológicas. Todo un valle.

El eldense Alberto Requena es catedrático emérito de Química de la Universidad de Murcia.