Hacia una ética de las imágenes digitales

En un reciente artículo el teórico de los nuevos medios Eugene Morozov sentenció que la inteligencia artificial ni es inteligente ni es artificial, sino que es el resultado del latrocinio

El robo llevado a cabo por programas informáticos de la obra de miles de artistas, músicos, programadores y escritores, del cual se apropian para remezclarlo siguiendo las órdenes de los usuarios es aquello a lo que denominamos IA en la actualidad, la cual no puede tener sentido de pasado, presente o futuro, ya que combina en un mismo plano y sin ningún tipo de sentido histórico todos los tiempos y espacios.

Esta ausencia de consciencia histórica choca frontalmente con otras imágenes anteriores que, antes que ellas, han deseado representar la realidad de una forma u otra, lo cual nos indica que los resultados, tanto visuales como textuales del software de inteligencia artificial generativa pertenecen a una nueva era. De acuerdo con teóricos como José Luis Brea o Vilém Flusser la imagen, en la actualidad, ha entrado en un nuevo tiempo, Brea la denominó e-image y Flusser imagen técnica. Esta nueva era, fruto de avances técnicos y tecnológicos en el tratamiento de la imagen, permite captar y representar lo inconcebible, de acuerdo con Flusser:

Las imágenes técnicas expresan el intento de plasmar sobre superficies los puntos elementales que nos rodean y que se encuentran en nuestra conciencia, a fin de llenar los intervalos abiertos entre ellos; el intento de poner en imágenes por un lado elementos como fotones o electrones, y por otro bits de información. Por eso no lo pueden efectuar los ni las manos ni los ojos ni los dedos. Pues tales elementos no son tangibles, visibles ni aprehensibles. Para ello hay que inventar aparatos que para nosotros puedan captar lo intangible, convertir en imágenes lo invisible y concebir lo inconcebible. Y, para poder ser controlados por nosotros, esos aparatos deben estar equipados con teclas. Tales aparatos son una condición para que se produzcan imágenes técnicas (Flusser 2011, 22)

Pensemos, por un momento, en las imágenes que hemos observado a lo largo y ancho de la red elaboradas mediante herramientas de inteligencia artificial generativas como MidJourney, Stable Difussion o Dall-E 2. En muchas de ellas aparecen temas o momentos inconcebibles y sin ningún sentido de pasado, presente o futuro. Por ejemplo, un campo de exterminio, Auschwitz, poblado por figuras nacidas en un videjuego, Minecraft, una historia global de la humanidad en la que todos los grupos aparecen posando para tomarse un selfie, la toma de la Bastilla grabada a través de un objetivo de gran angular, y un largo etc., pero también han aparecido otras imágenes que han hecho dudar sobre su autenticidad gracias a su verosimilitud, por ejemplo Vladimir Putin de rodillas frente a Xi Jinping o el expresidente estadounidense Donald Trump siendo arrestado en las calles de Nueva York. Ninguna de estas imágenes ha nacido de una realidad, no poseen calidad indicial, es decir, representan algo concreto, sino que logran parecer auténticas gracias a su capacidad de ser verosímiles, de hacer parecer verdad. Éstas son las imágenes técnicas, y todas ellas son elaboradas mediante máquinas.

Los aparatos son productos estúpidos: no podemos permitirnos antropomorfizarlos, por mucho que también puedan simular funciones intelectuales humanas. Para ellos no hay ningún problema con los puntos elementales: no quieren captarlos, representarlos ni comprenderlos. Para ellos, dichos elementos no forman más que un campo de posibilidades para su funcionamiento. Lo que para nosotros es difícilmente representable, es para el aparato sólo una simple posibilidad funcional (…). Y esto es la imagen técnica: una posibilidad que se concretiza ciegamente, un hacer ciegamente que lo invisible se torne visible (Flusser 2011, 22).

Para estos aparatos no existe ninguna diferencia en la forma que se representa Auschwitz, o cualquier otra tragedia humana, de la forma en la que se representa un juego infantil. De hecho, existen cientos de representaciones divergentes en sitios como OpenArt, donde podemos encontrar interpretaciones del campo de concentración y exterminio tan extrañas a una comprensión del pasado como: “¿Dónde está Wally visita Auschwitz, fotografía histórica, comedia”, una descripción que arroja resultados visuales como estos:

Un lugar y una herramienta que, además, nos permite remezclar estas imágenes añadiendo una nueva descripción que dialogue con lo mostrado. Por ejemplo, si a esta descripción le añadimos otra nueva palabra, “color”, el resultado es el siguiente:

Esta imagen no tiene ningún sentido, como no lo tienen las anteriores, estas herramientas no quieren captar el significado de aquello que muestran ni ofrecer ningún tipo de declaración al respecto. Lo único que hacen estos programas es representar un momento, un tema o una figura sin comprenderlo, y lo hacen siguiendo una serie de órdenes dadas por los usuarios, sin importar en absoluto que aquello que muestren pueda ser ofensivo, alucinatorio, irreal o insignificante, ya que lo único que desean es resolver dichas órdenes de la manera más eficaz posible en base al azar y la eficacia. Estas imágenes de los prisioneros de Auschwitz nos interpelan sin resentimiento, sin dolor, sin vergüenza y sin provocar ninguna responsabilidad hacia ellos y su recuerdo. Decía Svetlana Boym que la nostalgia es el recuerdo sin responsabilidad, y dicha irresponsabilidad parte de los propios medios con los que son creados estas imágenes. La inteligencia artificial, al crear retratos de personas que no existieron o imágenes de eventos sobre los que no tenemos información, nos muestra un sufrimiento inexistente. Las personas que podemos ver no tuvieron familia, tampoco amigos o conocidos. Son avatares digitales de un pasado artificial que nunca existió y que podemos ver y visitar sin ninguna responsabilidad hacia ellos. Este fenómeno abre un nuevo problema en cuanto a la representación visual del pasado conformadas mediante herramientas informáticas en la era del solucionismo tecnológico y la economía de la atención: la falta de responsabilidad ética hacia lo sucedido.

Somos la primera generación que dispone de la capacidad de conformar imágenes en el sentido estricto de los términos, de modo que, en comparación con nuestras imágenes, deben palidecer todas las modalidades pasadas de la conformación de imágenes, de la imaginación y de la ficción. Estamos accediendo a un nivel de conciencia en el cual la investigación de los más profundos contextos, en el cual el explicar, el enumerar, el relatar, el calcular, en suma el pensamiento lineal histórico, científico y textual es puesto de lado por un nuevo modo de pensar conformado en imágenes y “superficial”. Y por ello para nosotros ha perdido todo sentido querer diferenciar entre lo conformado como imágenes y lo conformado así, entre lo ficticio y lo “real”. El universo de puntos abstractos, a partir del cual emergemos, nos ha mostrado que todo aquello que no tiene una conformación como imagen se reduce a nada. De modo que hemos tenido que abandonar los criterios “verdadero/falso”, “original/falsificado” o “real/aparente” para emplear en cambio el criterio “concreto/abstracto”. La capacidad de conformar imágenes es la capacidad de concretizar lo abstracto (Flusser, 2011, pág. 39)

Esta dicotomía entre concreto y abstracto sigue siendo, hoy, la clave para diferenciar las imágenes elaboradas mediante programas de inteligencia artificial generativas. Todas las anteriores imágenes que hemos mostrado no muestran rasgos concretos en los rostros de los prisioneros, no enseñan lugares reales, concretos, y tampoco aparecen hechos o momentos específicos, no se encuentran ni en el tiempo ni en el espacio, tanto presente como pasado. Sin embargo, a medida que la capacidad fotorrealista de estas imágenes crezca y se eleve la dicotomía entre concreto y abstracto será más difícil de llevar a cabo y serán necesarias nuevas capacidades hermeneúticas específicas para examinar la autenticidad de lo mostrado, un acto que no es extraño al ser humano, acostumbrado a discernir entre auténtico y falso, entre concreto y abstracto, a lo largo de los siglos. Tan solo sería necesario, en este caso, recordar la investigación llevada a cabo por Lorenzo Valla (1407-1457) al respecto de la Donación de Constantino, la cual demostró ser falsa y presentada como tal en 1440 gracias al análisis lingüístico del texto. De la misma manera necesitaremos nosotros acudir a herramientas de crítica y análisis para demostrar que determinadas imágenes representan un hecho concreto o no. Sin embargo, no será este el aspecto crucial ya que la presión de la iconosfera que nos rodea no nos permitirá llevar a cabo este análisis con cada imagen que observemos, así como tampoco nos permitirá difundir los resultados de nuestra investigación a un público masivo como consecuencia de la falta de atención a la que nos han condenado los nuevos medios y plataformas sociales. Por ello, aunque este aspecto es relevante, debemos seguir perseverando en el análisis de estas imágenes de una perspectiva ética o memorística en cuanto al pasado se refiere haciendo hincapié en el segundo párrafo citado de Flusser:

Para ellos no hay ningún problema con los puntos elementales: no quieren captarlos, representarlos ni comprenderlos. Para ellos, dichos elementos no forman más que un campo de posibilidades para su funcionamiento. Lo que para nosotros es difícilmente representable, es para el aparato sólo una simple posibilidad funcional.

Comentaba Vincenzo Sparagna que cuando la realidad se reducía a la comunicación ésta era fácilmente modificable cambiando sus modos y sus contenidos. Nosotros, en nuestra escapada hacia la conversión de todo en imagen y a su consolidación como forma suprema de comunicación, estamos haciendo realidad el comentario de Sparagna. Si todo el pasado es representable en imágenes, como prometen estas herramientas, entonces es fácilmente modificable gracias a la transformación de sus contenidos y sus modos de presentación y representación.

Al respecto de esa cita de Sparagna, Jorge Luis Marzo en su libro Una historia del fake: la competencia de lo falso, afirmaba que lo falso no se definía exclusivamente por su voluntad de engañar al representar lo real, sino que logra exponer con acierto la principal “herejía” de la imagen: su capacidad de constituir una república propia, “capaz de hacer saltar por los aires a la doxa, el cuerpo de percepciones comúnmente establecido y aceptado, permitiendo una comunidad de paradoxas que, en última instancia, compromete la relación con la realidad al revelar cómo su apariencia se conduce mediante la contradicción y la ilusión de la fidelidad (2018: 40)”. Este es el camino que toman las imágenes técnicas, el de crear su propia república con sus propias normas y reglas completamente autónomas de las normas de representación asociadas a la cultura y la memoria del pasado, una visualidad del pasado sin consciencia de éste.

Así aparece en las imágenes anteriores la experiencia traumática de los campos de concentración y exterminio: representados bajo sus propios términos sin ningún tipo de conciencia histórica e independizados de las formas y debates que ha suscitado la representación de la Shoah. Una forma que emplea únicamente imágenes anteriores sin discernir su origen y despreocupada por completo de cualquier deber o responsabilidad hacia lo sucedido. Su único propósito es hacer realidad las fantasías, expresadas mediante órdenes, del usuario, como expresó Lewis Mumford hace más de 70 años, en 1952:

Hasta hemos dejado de crear autónomamente gran parte de nuestras fantasías, en efecto, estas carecen de realidad y viabilidad alguna hasta que están acopladas a la máquina, y sin la asistencia de la radio y la televisión [la tecnología] apenas tendrían energía suficiente para mantener su existencia (Mumford 2000, 40)

¿Es probable que el ser humano haya dejado de representar el pasado sin la ayuda de máquinas? Si recordamos las últimas manifestaciones visuales que de éste hayamos visto es más que probable que la mayoría corresponda a la imagen técnica, a aquella llevada a cabo mediante ordenador. ¿Iremos un paso más y dejaremos el pasado en manos de este tipo de herramientas? No podemos saberlo, pero aquello que sí sabemos es que la capacidad fotorrealista de estas herramientas resulta más atractiva que otro tipo de manifestaciones visuales y logra, gracias a ella, gracias a ser capaces de parecer más reales que lo real, confundirse con otros discursos históricos.

Como también advirtió Mumford: “el desarrollo mismo de las capacidades mecánicas ha infundido en las personas un falso ideal de perfeccionismo técnico, de tal manera que a menos que sean capaces de competir con los productos de la máquina o con los individuos cuya formación profesional los cualifica para realizares tales apariciones en público, están de lo más predispuestas a relegarse a sí mismas a un plano secundario” (Mumford 2000, 40). Es decir, que a menos que las manifestaciones visuales llevadas a cabo por cualquier de nosotros no pueda rivalizar con una realizada por un ordenador ésta no tendrá ningún tipo de valor de cara al público, como demuestra el valor dado a pintores o artistas cuyo valor reside, o al menos así lo defienden sus seguidores, en el detallismo y la capacidad fotorrealista.

Si todo esto es cierto, corremos el peligro de que toda mediación cultural que establezcamos con el pasado la llevemos a cabo través de una máquina y a través de imágenes elaboradas mediante máquinas, lo cual podría conducir, de acuerdo con Neil Postman, a un escenario donde lo representado no importe lo más mínimo y sea el cómo se hizo, el elemento técnico, el único aspecto relevante, y una vez aquí toda la historia quede convertida en repositorio de temas para su conversión en imágenes técnicas. Planteado en los términos más dramáticos: se puede formular la acusación de que el crecimiento sin control de la tecnología destruye las fuentes esenciales de nuestra humanidad, crea una cultura sin fundamentación moral y socava algunos de los procesos mentales y de las relaciones sociales que hacen que una vida humana merezca la pena de ser vivida.