Popularidad y controversias sobre inteligencias artificiales que generan imágenes: ¿son útiles?, ¿son éticas? ¿generan arte?
Aunque estas tecnologías no son precisamente nuevas, durante 2022 los algoritmos en redes sociales ayudaron a popularizar diferentes apps para diseñar imágenes digitales a partir de frases cortas. ¿Qué debates abren estos nuevos paradigmas y qué conversaciones se tienen al respecto?
Las apps para generar imágenes basadas en inteligencia artificial y machine learning se popularizaron de manera particular este 2022. Durante varias semanas las tendencias en redes sociales impulsaron no solo el nombre de herramientas específicas, sino también las creaciones de usuarios que experimentaron con ellas: desde las más realistas y de alguna manera fáciles de intuir, hasta algunas cosas meramente especulativas y abstractas.
No cabe duda, además de estar en una etapa de ensayos, también se trata de una fase de democratización para este tipo de instrumentos digitales.
Por si no los conoces, te explico su funcionamiento a grosso modo. Más allá del nombre del software (exploraremos ejemplos más adelante), tienes que introducir una palabra, frase o concepto. En algunos casos seleccionar un estilo gráfico, escuela pictórica, o tendencia artística. Y tras unos segundos los cómputos te arrojarán una imagen generada específicamente para ti según los datos que proveíste.
Sin embargo, más allá de su funcionamiento concreto (viene un argumento totalmente subjetivo, so deal with it), lo que resulta más fascinante de todo esto no son los archivos generados, sino las discusiones e implicaciones coyunturales que este tipo de programas están despertando.
Cuestionamientos que circundan dilemas éticos, de privacidad de datos, estéticos, raciales y en algunos casos hasta de espionaje. En este artículos haremos un breve repaso sobre los primeros cuatros puntos y dejaremos el último para una entrega más robusta y detallada en otro momento.
TE PUEDE INTERESAR: ‘Severos’ recortes de costos salvaron a Twitter, declara Elon Musk
THIS PERSON DOESN’T EXIST
Una de las primeras herramientas de las que recuerdo haber escuchado sobre generación de imágenes realistas mediante software fue This person doesn’t exist. Su descripción dice lo siguiente: “¡Genera una cara humana al azar en 1 clic y descargarla!”.
Y es tan sencillo como eso. Las dos imágenes de abajo han sido generadas gracias a esta inteligencia artificial. Imágenes que se basan en el algoritmo StyleGAN de NVIDIA, que toma más de 100 factores distintos para la producción gráfica, como la posición de la cara, la personalidad de la persona, el género, el estilo de pelo, entre otros.
Elegí dos retratos de infantes a propósito, aunque las opciones que se pueden son bastante amplias y al menos en este caso no advertí que hubiera discrminación por color de piel, edad o género. Y digo que los retratos los escogí a propósito porque de existir, si estos niños fueran reales, tendría que existir un permiso firmado por sus padres o tutores para poder usar su imagen en este artículo.
O bien tendría que recurrir a suavizar o borrar algunos gestos para no comprometer su integridad y datos personales.
Ya desde aquí, el principio de generar imágenes cambia la forma en que hacemos las cosas y cómo se relacionan esos objetos digitales con sus propios entornos. ¿Llegará un momento en que este tipo de procesos estén mayoritariamente regulados? Todavía no lo sabemos con certeza.
Lo crucial aquí es lo fácil que es generar una imagen realista que puede ser usada con cualquier fin. Ilustrar un artículo como este, donde se hace explícita que son personas que no existen. O bien se podrían usar para falsificar documentos, hacerse pasar por otras personas, y no daremos más ideas al respecto. Aquí, como en casi cualquier caso, la imaginación es el límite.
DEEP NOSTALGIA
En febrero de 2021, la empresa MyHeritage lanzó una inteligencia artificial llamada Deep Nostalgia que permite animar fotografías estáticas de personas. A la fecha, de acuerdo con el sitio, se han hecho más de 105 millones de animaciones.
Aquí lo que hace el algoritmo es buscar rasgos faciales y darles movimiento, para que parezca que están haciendo gestos. Esto, cabe recalcar, solo funciona con foto de un rostro humano.
Si sigues los pasos correctos, puedes ver uno de los resultados dando click aquí.
La controversia aquí es que MyHeritage originalmente lanzó un video que da pie a pensar en los deep fakes.
Y no es una opinión aislada. Comentarios al respecto surgieron en diversos foros como Reddit. La empresa afirma que para evitar esto la herramienta no incluirá opciones en donde la boca se mueva o simule el habla, a fin de de que Deep Nostalgia no imite algún discurso.
DALL-E
Esta app provocó revuelo desde que estaba en fase de prueba, así como con sus respectivas versiones. Y ahora que está en versión completa está disponible para todo el mundo.
El funcionamiento es sencillo. Introduces un concepto, das click en dibujar y la herramienta hace el resto.
En este caso los resultados llamaron la atención por lo hilarantes o absurdos que podían llegar a ser. Aquí algunos ejemplos.
Hasta septiembre de 2022, la empresa confirmó haber interactuado con 1.5 millones de usuarios y generado más de 2 millones de imágenes diarias.
TE PUEDE INTERESAR: Notificarán alertas sísmicas en celulares a partir de 2023 en CDMX
Dado que los inputs está abiertos a al consideración humana, muchas de las peticiones estaban relacionadas con peticiones ofensivas. Por eso mismo, OpenAI respondió que “Aprender del uso en el mundo real nos ha permitido mejorar nuestros sistemas de seguridad, haciendo posible una disponibilidad más amplia hoy día. En los últimos meses, hemos fortalecido nuestros filtros para rechazar los intentos de generar contenido sexual, violento y de otro tipo que infrinja nuestra política de contenido, y hemos creado nuevas técnicas de detección y respuesta para detener el uso indebido”.
MIDJOURNEY
La escala sube un poco en el impacto cuando hablamos de Midjourney. Y es que el nivel de detalle y realismo que presenta es notablemente más elevado que el resto de las opciones.
Su funcionamiento es similar. Debes introducir conceptos específicos, así como una serie de parámetros visuales para que se genere la imagen.
Una de las cosas más sorprendentes es que algunas personas usaron esta herramienta para intentar recrear estilos visuales de artistas reconocidos. Ya sea en fotografía, cine o videojuegos internet está lleno de ejemplos como el que verás a continuación:
Como ya comentamos, muchos usuarios comenzaron a generar frames posters de películas, y fue entonces cuando descubrieron una herramienta que específicamente hace esto: This movie doesn’t exist.
Esta permite generar afiches aleatorios, o bien uno más personalizado introduciendo nombre, sinópsis y un género.
STABLE DIFFUSION & RIFFUSION
Después de todos los casos que se vieron en la primera mitad del año, en agosto de 2022 fue lanzada la nueva app que causó furor. Y aunque quizá no fue tan popular en el mainstream, si entre los artistas digitales. Se trata de Stable Diffusion, que destaca, además de la versatilidad en las imágenes creadas, por las integraciones y plugins que permiten expandir sus propios límites.
¿Cuál es el secreto? El código abierto.
La siguiente es una imagen que fue generada bajo el input: “un mecha invade México y el chavo del 8 sale en su defensa”.
La gran sorpresa llegó al cierre del año cuando Seth Forsgren y Hayk Martiros desarrollaron Riffusion, una plataforma que puede generar imágenes de espectogramas que a su vez pueden ser convertidas en audio. Dicho de otra forma, convierte imagenes en sonido.
En la página oficial pueden encontrarse algunos ejemplos y una explicación sumamente detallada del funcionamiento del software, así como el código mismo.
LENSA
La última de las aplicaciones que llamaron la atención este 2022 fue Lensa. Si no llegaste a ver imágenes generadas por los ejemplos anteriores, es muy probable que estas sí que la hayas visto al menos una vez en redes sociales.
La diferencia con las otras herramientas es que esta no parte de conceptos externos abstractos, sino que toma como base una selfie.
Lensa se describe a sí misma como un “editor de fotos que te permite retocar las fotos con infinidad de efectos”.
TE PUEDE INTERESAR: Afectan ‘autos chocolate’ venta de vehículos nuevos, alertan distribuidores
Las críticas llegaron cuando se esparció la información de que esta aplicación estaba robando o usando los datos personales de los usuarios sin autorización.
Por su parte, Prisa Lab, la desarrolladora de Lensa, declaró que si bien el usuario conserva los derechos de autor sobre el contenido que genera: “Usted nos concede una licencia perpetua, revocable, no exclusiva, libre de regalías, mundial, totalmente pagada, transferible y sublicenciable para utilizar, reproducir, modificar, adaptar, traducir, crear trabajos derivados y transferir su Contenido de Usuario, sin ninguna compensación adicional para usted y siempre sujeto a su consentimiento explícito adicional para tal uso cuando sea requerido por la ley aplicable y como se indica en nuestra Política de Privacidad)”.
No es la primera vez que se cuestionan las letras pequeñas de este tipo de softwares, pues ya había ocurrido algo parecido con FaceApp, herramienta que ganó popularidad al hacer supuestos cambios de género en las imágenes en 2020.
OTRO TIPO DE IMPLICACIONES
Todo lo que ocurrió este año incrementó el debate sobre derechos de autor, las regulaciones necesarias para este tipo de herramientas, si las personas que generan este tipo de imágenes son artistas o no, si los resultados que arrojan los algoritmos pueden ser considerados racistas o discriminadores.
Lo cierto es que estos asuntos todavía están muy en el presente como para abordarlos con claridad, pero lo seguro es que el debate seguirá y seguirá y seguirá. ¿Tú qué opinas?
COMENTARIOS