Parte I
Las ideas de este artículo son una síntesis personal de la tesis central del investigador Jürgen Schmidhuber[1], pionero de la inteligencia artificial. En particular, deseo centrarme solo en aquellos aspectos relacionado con los orígenes de los ideales de belleza, como se explica en su trabajo Driven by Compression Progress: A Simple Principle Explains Essential Aspects of Subjective Beauty, Novelty, Surprise, Interestingness, Attention, Curiosity, Creativity, Art, Science, Music, Jokes. La tesis fundamental del autor se puede resumir en el llamado principio de la compresión de información.
Nuestros cerebros se enfrentan al problema de comprender un mundo que es realmente imposible de conocer en su totalidad, y al que tenemos acceso solo de manera fragmentaria. Nuestro sitema cognitivo se ve en la obligación de comprimir la información que obtenemos a través de los sentidos, y a crear representaciones sintéticas en nuestros cerebros que simplifiquen la inaprensible complejidad que nos rodea.
Ante la imposibilidad de almacenear una información que desborda las capacidades de nuestra memoria, nuestros cerebros se han visto condicionados a mantener solo unas pocas reglas globales, que no obstante permiten inferir principos generales sobre los mecanismos innerentes al mundo físico. Guardamos en la memoria la historia cruda de las acciones y observaciones sensoriales, incluidas las respuestas emocionales que experimentamos al recibir las señales del mundo exterior, que incluyen a su vez las emociones de recompensa. Los datos fundamentales, la información general, es todo lo que nuestros cerebros pueden procesar acerca del mundo físico.
De manera simplificada, podríamos argumentar que los aspectos del mundo que son en realidad del mayor interés serían aquellos que nos permiten encontrar o crear regularidades nuevas que podamos aprender. Nuestra atención se irá naturalmente hacia esos lugares que ofrecen información susceptible de ser comprimida, información compresible (en el sentido de que se deja comprimir) y por ende comprensible. Solo así podemos descubrir cómo funcionan las cosas.
El verdadero objetivo de un sistema cognitivo biológico no se restringe a satisfacer la mera curiosidad, sino que debe estar en la capacidad de resolver los innumerables problemas externos a los que se enfrenta. Para lograrlo, esos problemas deben ser formalizables, o sea, deben ser expresables en un lenguaje accesible para el agente. El agente tratará siempre de maximizar la recompensa externa esperada. La recompensa interna es la emoción; la externa es el logro real de una meta dada.
En su tesis, Jürgen Schmidhuber argumenta que para poder recoger y sintetizar un historial especifico de observaciones y experiencias, la red neuronal que comprime la realidad (por ejemplo, una red neuronal predictiva) creará automáticamente representaciones o símbolos internos para designar aquellos objetos y patrones que se repiten con frecuencia, incluso cuando la previsibilidad es limitada. El objetivo es realizar una compresión eficiente, lo que se logra mediante códigos cortos que se asocian a eventos que sean predecibles con alta probabilidad. Por ejemplo, “el Sol sale todos los días”. Es eficaz crear símbolos internos, como el signo de la luz del día, para describir este aspecto repetitivo del historial mediante un breve fragmento de código interno reutilizable, en lugar de coleccionar infinidad de datos sin procesar.
Para Jürgen Schmidhuber se puede identificar la belleza subjetiva de un objeto que es observado según el número proporcional de bits necesarios para codificarlo. En palabras menos técnicas: al apreciar la belleza estamos codificando fenómenos complejos, reduciéndolos a patrones simples o a principios verificables y comprimidos que ilustran la generalidad de lo observado.
La belleza sería entonces una apreciación subjetiva, pues dependerá de la capacidad de cada agente de comprimir información nueva que aún no ha procesado. Esta capacidad, a su vez, dependerá de la experiencia o memoria de experiencias similares que le permiten al agente hacer la codificación en unos pocos bits. Así que el grado en que nuestros cerebros comprimen lo observado varía en el tiempo y respecto a otros cerebros. Schmidhuber nos pide que no olvidemos que el agente mismo, o sea el cerebro o la inteligencia que procesa los datos, está involucrado en todas las acciones y estímulos sensoriales; así que debe representarse a sí mismo simultáneamente.
La capacidad para apreciar “la belleza” de un objeto será proporcional entonces al tiempo que el agente dedique a observarlo. A mayor exposición, su red neuronal será capaz de encontrar los patrones más comprimibles, para luego reorganizarlos con mayor eficacia en su cerebro.
Creo que nuestros cerebros no solo organizan la realidad que han comprimido en datos, sino que además se reorganizan a medida que adquieren más información. La experiencia no solo añade información, sino que aumenta asimismo la capacidad de comprimir esa información al disponer de más patrones útiles para codificarla. De esta manera nuestra red neuronal se especializa en el tipo de información que es capaz de organizar, y en la manera como lo hace.
La reorganización en categorías que se deriva de una mayor exposición a un fenómeno dependerá además de cuán sorprendente este resulte ser: entre más sorprendente, o sea, entre más grande el descubrimiento, más reorganización necesitará hacer nuestro cerebro. A mayor tiempo gastado en la observación, mayor facilidad para encontrar patrones, mayor capacidad de hacer conexiones entre estos patrones y mayor capacidad de comprimir aún más la información.
Entre los varios patrones clasificados como “comparables” por un observador, el más bello subjetivamente será el que se pueda describir de la manera más simple, más económico en bits de información. De ahí que los matemáticos encuentren belleza en una demostración sencilla, argumenta Schmidhuber.
Por ejemplo, la célebre ecuación, e^πi+1=0 es famosa por su belleza, y se le considera una obra de arte de su creador, Leonhard Euler. Uno de los matemáticos más influyentes de la historia. La fórmula exhibe una profunda conexión entre cinco de los números más importantes en matemáticas: El 0, que representa la nada, el punto de partida. El número 1, que representa la unidad, el elemento básico de la contabilidad. La constante π, que relaciona la circunferencia del círculo con su diámetro. El número e, base de los logaritmos naturales, otro número irracional con infinitas decimales. Y la unidad imaginaria i, raíz cuadrada de -1. La ecuación de Euler, a pesar de su sencilla apariencia, captura una relación fundamental entre conceptos aparentemente distintos. La ecuación no depende de un sistema de unidades o de una base numérica particular; revela una verdad matemática universal.
Schmidhuber sostiene, de otro lado, que la belleza dependerá del grado de sorpresa, del grado de novedad que la red neuronal o agente experimente ante un objeto o experiencia. La sensación subjetiva de belleza se experimenta mientras sea novedosa, es decir, mientras la regularidad algorítmica que la hace simple aún no haya sido completamente asimilada por el observador. Una vez el agente logra comprimir la información dejará de experimentar curiosidad y sensación de belleza. Su tesis apoya la idea de que lo manido deja de percibirse como bello.
Por ejemplo, para codificar eficientemente rostros humanos vistos previamente, a un compresor, a una mente, a una red neuronal, puede resultarle útil generar una representación interna de un prototipo de rostro. Así que, al codificar una cara nueva, la red solo tendrá que codificar las desviaciones del prototipo central. Según la lógica de esta teoría de la belleza, una nueva cara que no se desvíe mucho del prototipo será subjetivamente más bella que otras que, en cambio, se alejan del prototipo. De manera similar, para caras que exhiben regularidades geométricas como simetrías o proporciones simples, en principio, el compresor puede explotar cualquier regularidad para reducir el número de bits necesarios para almacenar los datos, y serán percibidas como más bellas.
El actor francés Alan Delon. Un rostro considerado bello por gran parte de la población Occidental.
Lo totalmente predecible y lo completamente aleatorio nos resulta aburrido, como ocurre con el ruido y con la oscuridad. La oscuridad resulta trivialmente compresible, y por consiguiente totalmente predecible (entradas visuales inmutables, en palabras de Schmidhuber). De otro lado, una pantalla llena de ruido blanco, saturada de información incompresible, nos resulta impredecible y fundamentalmente incompresible. En ambos casos, los datos son aburridos porque no permiten un mayor progreso en la compresión.
Schmidhuber hace énfasis en las recompensas de tipo intrínseco, que resultan ser proporcionales al progreso en el aprendizaje. Debido a las limitaciones del agente compresor, la mente trata en lo posible de seleccionar secuencias de acción que optimicen el tiempo de compresión. De aquí que la primera derivada de la belleza subjetiva sea: a medida que la red neuronal mejora su algoritmo de compresión, aquellos datos que antes parecían aleatorios se vuelven subjetivamente más regulares y hermosos, pues requieren cada vez menos bits para su codificación. Mientras este proceso no termine, los datos seguirán siendo interesantes y gratificantes.
El agente aprende a centrar su atención en asuntos que en el presente resultan incompresibles, pero que espera se conviertan en comprimibles o predecibles en un futuro. Sin embargo, el interés se pierde cuando la información se vuelve incompresible o si los costos para codificarla son excesivos.
Yo creo que las ideas de este artículo son muy interesantes, pero no explican la complejidad de la apreciación de la belleza. En los términos mismos del artículo, el algoritmo que reduce la belleza a una máxima compresión de una gran información, deja sin comprimir, deja sin explicar, distintos aspectos de la belleza.
El artículo de Schmidhuber: https://arxiv.org/pdf/0812.4360
Una explicación en YouTube: https://www.youtube.com/watch?v=TnRHdKYQcr8&t=199s
[1] Jürgen Schmidhuber es pionero en el campo de la inteligencia artificial. Considerado por muchos como el “padre de la IA”, ha realizado contribuciones fundamentales en áreas como el aprendizaje profundo y las redes neuronales artificiales. Es director científico de IDSIA: Desde 1995, dirige el Instituto Dalle Molle de Investigación en Inteligencia Artificial (IDSIA), un centro de excelencia a nivel mundial en este campo.