viernes, 21 de noviembre de 2025

Muchas IA de vídeo están aprendiendo a imitar el mundo. Y todo apunta a un “saqueo” sin precedentes de YouTube


Las IA están aprendiendo a hacer vídeos cada vez más realistas

Una investigación señala a YouTube como fuente clave de esta mejora

El debate se centra en el uso de contenido sin permiso y en los futuros acuerdos

Las IA de vídeo ya pueden generar escenas en un pispás. El resultado sorprende, pero también abre una pregunta que hasta hace poco apenas se planteaba: ¿de dónde han salido todas esas imágenes que les han permitido aprender a imitar el mundo? Según The Atlantic, parte de la respuesta apunta a millones de vídeos extraídos de plataformas como YouTube sin un consentimiento claro.

La euforia por la IA generativa ha ido tan rápido que muchas preguntas se han quedado atrás. En apenas dos años hemos pasado de pequeños experimentos curiosos a modelos que producen vídeos casi indistinguibles de los reales. Y mientras el foco estaba en las demostraciones, otra cuestión iba ganando peso: la transparencia. OpenAI, por ejemplo, ha explicado que Sora se entrena con datos “disponibles públicamente”, pero no ha detallado cuáles.
Un entrenamiento masivo que señala a YouTube

La pieza de The Atlantic da una pista clara de lo que estaba ocurriendo entre bastidores. Hablamos de más de 15 millones de vídeos recopilados para entrenar modelos de IA, con una enorme cantidad procedente de YouTube sin autorización formal. Entre las iniciativas citadas aparecen conjuntos de datos asociados a varias compañías, diseñados para mejorar el rendimiento de los generadores de vídeo. Según el medio, este proceso se realizó sin avisar a los creadores que publicaron originalmente ese contenido.

Uno de los aspectos más llamativos del hallazgo es el perfil del material afectado. No se trataba solo de vídeos anónimos o grabaciones domésticas, sino de contenidos informativos y producciones profesionales. El medio encontró que miles de piezas procedían de canales pertenecientes a publicaciones como The New York Times, BBC, The Guardian, The Washington Post o Al Jazeera. En conjunto, hablamos de un volumen enorme de periodismo que habría terminado alimentando sistemas de IA sin un acuerdo previo con sus propietarios.

Runway, una de las empresas que más impulso ha dado al vídeo generativo, aparece señalada en los conjuntos de datos revisados. Según los documentos citados, sus modelos habrían aprendido con clips organizados por tipo de escena y contexto: entrevistas, explicativos, piezas con gráficos, planos cocina, planos recurso. La idea es clara: si la IA debe reproducir situaciones humanas y narrativas audiovisuales, necesita referencias reales que cubran desde gestos hasta ritmos de edición.


Alemania convierte a cucarachas en enjambres de biorrobots para misiones de espionaje

  Alemania está desarrollando enjambres de cucarachas biorrobotizadas mediante una empresa llamada SWARM Biotactics, que les coloca micro-mo...