Los modelos de IA generativa no paran de crear contenidos y, luego, de retroalimentarse con ellos.
Las empresas no parecen poder (o querer) hacer frente a la que se postula como gran amenaza de internet.
Qué felices éramos todos antes de 2023. Antes de que los ChatGPT y los DALL-E del mundo hubieran entrado en nuestras vidas. Antes de que sus «mágicas» capacidades comenzaran a maravillarnos mientras hacían otra cosa:
Matar internet.
Es al menos lo que analistas como Ed Zitron creen que está pasando. Según él, puede que estemos viendo morir a internet tal y como la conocíamos. Y lo peor de todo es que tiene un argumento potente para creerlo.
Ese argumento no es otro que el de cómo la IA generativa lo está contaminando todo. Lo comenzó a hacer en 2023, cuando las imágenes y textos generados por modelos de IA como los de OpenAI comenzaron a infiltrarse en las redes sociales.
Aquello parecía hasta maravilloso: qué bien escribía la IA. Qué chulas eran las imágenes —mientras no le pidieras que dibujara manos—. Compartíamos esas creaciones en Twitter, o Facebook, o Instagram, y no nos dábamos cuenta de algo importante.
Estábamos alimentando un monstruo.
Seguimos haciéndolo, pero es que además cada vez lo hacemos con mayor intensidad. Y el peligro es que esos modelos de IA que hasta 2023 se habían alimentado solo de textos e imágenes generados por humanos, ahora han vuelto caníbales.
Comen datos generados por ellas mismas, retroalimentándose una y otra vez en un peligroso círculo vicioso. Un bucle infinito que puede acabar dando como resultado unos inquietantes modelos mutantes de IA generativa. No es algo que descubramos ahora: estaba claro que la IA estaba llenando internet de contenidos. La pregunta era qué pasaría cuando esa IA se retroalimentase de esos contenidos.
Jathan Sadowski, investigador en el ámbito de la economía política de las tecnologías de la información, se adelantaba a la reflexión en febrero de 2023, cuando acuñaba el término «Habsburg AI», esto es:
«Un sistema tan entrenado con los resultados de otras IA generativas que se convierte en un mutante endogámico, probablemente con rasgos exagerados y grotescos».
La situación comienza a ser preocupante para muchos como Zitron, que indican que no estamos ante modelos de IA generativa, sino degenerativa: la calidad de internet se va a pique, asegura. Y hay ejemplos por doquier.
Abres Instagram y te encuentras con una maravillosa imagen de una mansión. Los comentarios lo dejan claro: es una maravilla. Luego, con otra de un pueblecito italiano, pero que tiene apellido: IA.
El autor ha tenido el detalle de avisar de que la imagen no es real, pero en los comentarios la gente —o los bots, a saber— parece descartar el detalle. De nuevo todos apuntan a que la imagen es una maravilla.
Una bola de nieve que no para
La escritora Carmen Pacheco compartía ese y otros ejemplos en un hilo en X/Twitter estos días, y entre esas demostraciones de una internet contaminada por la IA estaba otra peligrosa: la de los resultados de búsqueda de Google, que ya muestran en sus primeras posiciones no imágenes generadas por seres humanos, sino creaciones de una IA. Tampoco es algo nuevo: lo vimos con la joven de la perla.
El problema es que nadie parece querer (o poder) frenar esta bola de nieve gigante que se está formando. Las empresas desde luego no parecen estar por la labor: Como dice Zitron, LinkedIn «permite generar mensajes, perfiles y descripciones de ofertas de empleo mediante IA», y todas esas publicaciones acaban retroalimentando los modelos de OpenAI, porque Microsoft invirtió miles de millones en ella y tienen acuerdos al respecto.
Google permite que sus modelos de IA te escriban borradores de correos en su plataforma Google Workspace Labs, y los responsables de WordPress tienen su Jetpack AI Assistant para que los post de tu publicación los escriba una máquina —cuidado, igual no te sale bien—.
Esta fiebre por dejar que las máquinas escriban por nosotros —uf qué pereza, escribir uno mismo— está también causando un terrible impacto en Amazon, que ha visto cómo no los modelos de IA no paraban de publicar obras a diestro y siniestro. Y no hablamos de maravillosas epopeyas o ensayos, no: hablamos de resúmenes de libros reales, biografías no autorizadas y textos que (al menos de momento) no tienen valor alguno y solo sirven para contaminar la oferta existente.
El peligro se extiende a la generación de contenidos baratos y engañosos que no paran de inundar redes como TikTok, donde algunos jóvenes enseñan cómo ganar dinero con minivídeos que son una oda al clickbait y que gracias a verse millones de veces pueden resultar muy rentables.
Y como venimos diciendo, nadie parece hacer frente a esta preocupante dinámica. Google es probablemente la primera que debería reaccionar, sobre todo teniendo en cuenta que para mucha gente internet y Google son sinónimos.
La empresa liderada por Sundar Pichai tiene otros muchos problemas, pero su propia reputación peligra si su buscador empieza a dejar de mostrar contenido relevante.
Han comenzado a mover ficha con cambios en su algoritmo que teóricamente castiga contenidos pobres, de spam y generados por IA (ellos lo llaman contenidos automatizados de baja calidad), pero como dice Zitron, llevan años ganando mucho dinero gracias a ese mundo SEO paralelo creado por ellos: no parece fácil creer que vayan a resolver realmente el problema a corto plazo.
Mientras, el resto de empresas parecen felices con este aluvión de contenidos porque, sencillamente funcionan. Las mansiones generadas por IA de las que hablábamos al comienzo de este artículo triunfan en Instagram, pero también lo hicieron los alucinantes vídeos de Sora que plantean una revolución igual de peligrosa para TikTok o YouTube.
Una en la que los futuros vídeos se nutrirán de estos que ya han sido generados por una IA y que todo a punta a que serán cada vez peores para acabar convirtiendo internet en un basurero de contenidos generados por IA.
Quedará, eso sí, un refugio. El de rebuscar en la internet pre-IA. ¿Cómo? Fácil:
Como decía Dennis Müller en X (Twitter), poniendo un «before:2022» en el buscador de Google para que los resultados no incluyan aquellos generados por las máquinas.
Javier Pastor