Tecnología

«Los rastreadores de inteligencia artificial están arruinando Internet»: los bots amenazan incluso a Wikipedia

Share
Share

Internet está bajo asedio. Y no por ciberdelincuentes, sino por una ola creciente de bots de inteligencia artificial que consumen ancho de banda como nunca antes.

Su misión: rastrear y recolectar grandes volúmenes de contenido —textos, imágenes y videos— para entrenar modelos de lenguaje y generadores de imágenes. Pero el coste de esta actividad lo están pagando algunos de los pilares del conocimiento abierto, como Wikimedia, y miles de proyectos de software libre que operan con recursos limitados.

Desde comienzos de 2024, la Fundación Wikimedia ha registrado un aumento del 50 % en el consumo de su ancho de banda, sobre todo en su repositorio multimedia, Wikimedia Commons. En momentos de alta demanda —como tras el fallecimiento del expresidente estadounidense Jimmy Carter—, este tráfico excesivo provocó lentitud en la carga de páginas y saturación de conexiones para los usuarios.

Lo más preocupante es que no se trata de un aumento del interés humano. La mayoría de ese tráfico proviene de bots automatizados —muchos de ellos no identificados— que extraen contenido para alimentar sistemas de inteligencia artificial.

En la práctica, esto significa que cerca del 65 % de las conexiones a los servidores centrales de Wikimedia están siendo ocupadas por rastreadores que no respetan normas básicas como el archivo robots.txt, diseñado para limitar el acceso de bots a ciertos contenidos.

El modelo de Wikimedia se basa en el principio de “conocimiento como servicio”: su contenido es gratuito y libre de reutilizar, lo que ha sido clave en el desarrollo de buscadores, asistentes de voz y, más recientemente, modelos de IA. Pero esa misma apertura se está volviendo en su contra.

La situación es aún más crítica para proyectos de software libre pequeños, mantenidos por comunidades o desarrolladores individuales. Muchos están viendo cómo sus recursos se agotan debido al tráfico generado por bots, lo que dispara los costos o, directamente, deja a los proyectos fuera de línea.

Gergely Orosz, desarrollador y autor de The Software Engineer’s Guidebook, vivió esto en carne propia: el uso de datos en uno de sus proyectos se multiplicó por siete en pocas semanas, obligándolo a pagar penalizaciones por el exceso de tráfico.

Ante este panorama, algunos desarrolladores están pasando a la ofensiva. Herramientas comunitarias como Nepenthes o soluciones empresariales como AI Labyrinth de Cloudflare han comenzado a utilizar “tarpits”: trampas de contenido falso o irrelevante (en muchos casos, también generado por IA) que engañan a los bots, haciéndoles perder recursos sin obtener información útil.

En el fondo de esta crisis subyace una contradicción profunda: la misma apertura que permitió el auge de la inteligencia artificial está poniendo en riesgo la supervivencia de los espacios abiertos que la hicieron posible. Las empresas de IA se nutren del conocimiento libre, pero no contribuyen a sostener su infraestructura. Esta externalización de costes pone en jaque la sostenibilidad del ecosistema.

Si no se alcanza un nuevo consenso, el mayor riesgo no es que la IA se quede sin datos, sino que los espacios abiertos que la alimentan acaben desapareciendo por falta de apoyo.

Share
Written by
Jhon Soto

Apasionado por compartir contenido relevante y entretenido. Me encanta explorar temas actuales y transformar ideas en artículos que conecten con las personas. ¡Acompáñame en este viaje de historias y tendencias!

Leave a comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Related Articles
Tecnología

Estados Unidos concede una nueva prórroga a TikTok

El presidente Donald Trump anunció que ha firmado una orden ejecutiva para...

Tecnología

AMD recomienda actualizar la BIOS de tu placa base si utilizas un procesador Ryzen 9000X3D

A finales de 2024, AMD lanzó el Ryzen 7 9800X3D, el procesador...

Tecnología

Hayao Miyazaki, director de Studio Ghibli, rechaza las imágenes generadas con IA: “Es un insulto a la vida misma”

En los últimos días, las redes sociales se han visto inundadas de...

Tecnología

Según The New York Times, Amazon ha presentado una oferta para adquirir TikTok en Estados Unidos

Amazon ha presentado una oferta de última hora para adquirir TikTok en...

Plataforma de Gestión del Consentimiento de Real Cookie Banner