La CTO de OpenAI afirma desconocer el origen de los datos con los que se entrenó a SORA

Cuando todavía hay gente que se sorprende por las posibilidades de uso de ChatGPT, su matriz OpenAI ya piensa en el lanzamiento de SORA, el software de generación de video por inteligencia artificial.

Basada en un estilo de trabajo similar al del popular chat (es decir, describir en texto lo que se pretende que haga la IA), SORA promete generar videos de hasta 60 segundos con una calidad y fluidez excepcional, aunque por supuesto contará con algunos fallos propios de un modelo temprano. Uno de los aspectos en los que ya se trabaja es la incorporación de sonido a la imagen.

Hace dos días la CTO de la compañía, Mira Murati, fue entrevistada por The Wall Street Journal a propósito de este software. De aquel encuentro se desprendieron algunos aspectos interesantes, como por ejemplo el anuncio sorpresa de que SORA estará disponible al público antes de acabar el año.

No obstante lo anterior, lo que verdaderamente ha levantado polémica ha sido la respuesta a la pregunta de con qué material se había entrenado al programa. La entrevistadora en concreto se cuestionaba si existía material de YouTube, Instagram o Facebook en el mix de fuentes. Ante tal pregunta, Murati contestó con un escueto “No estoy segura”.

Claro está, a nadie se le escapa que la máxima responsable tecnológica de un proyecto como este sabe perfectamente de dónde viene el material con el que nutre su software. Esta falta de claridad no ha tardado en levantar críticas en las redes sociales, advirtiendo de que se gesta un nuevo frente judicial por la vulneración de derechos de propiedad intelectual, algo que ya es marca de la casa en OpenAI.

SORA reabre la polémica por el uso del copyrigth

Parece que OpenAI tiene un serio problema con el pago de derechos de autor. El historial de vulneraciones es muy amplio y abarca demandantes de lo más variopinto.

A finales de diciembre de 2023, el periódico The New York Times demandó a la tecnológica por utilizar sus artículos para en entrenamiento de su IA. En la demanda pueden leerse cosas como:

“Los demandados buscan aprovecharse de la enorme inversión que ha hecho el Times en su periodismo […] usan el contenido del Times sin pagar para crear productos que sustituyen al Times y le roban audiencia”.

Antes de este pleito, OpenAI fue demandado colectivamente por 17 escritores de reconocido prestigio, entre los que se encuentran George R.R. Martin (autor de Juego de Tronos) o John Grisham, por la utilización de sus trabajos sin autorización expresa de los creadores.

En mayo del mismo año, el sindicato de guionistas de EEUU reivindicaba en su huelga un control férreo en el uso de la IA. No tanto por el potencial trabajo que se podía perder (que también) sino sobre todo porque para su entrenamiento seguramente se habría recurrido a obras sin permiso.

¿Qué información tenemos sobre SORA por el momento?

Si bien la noticia del lanzamiento en 2024 ha supuesto una buena noticia para los seguidores de OpenAI, todavía se desconoce si éste será a escala global o irá por zonas geográficas. Esta última posibilidad no es del todo descartable, habida cuenta de que jurisdicciones como la UE están aplicando severas medidas de control a esta tecnología.

En lo referente a las fuentes de trabajo, se sabe que los videos se generarán con contenido de licencia abierta y también videoproducciones de Shuttershock. Con esta última OpenAI habría alcanzado un acuerdo para convertirse en proveedor.

Uno de los aspectos en donde se pretende tener especial cuidado es en la realización de los DeepFakes. Ya existen numerosas regulaciones al respecto y cientos de condenas por vulneración de derechos al honor y la intimidad. Seguramente lo último que quiera OpenAI es que SORA sirva como barra libre para este tipo de manipulaciones.

Artículos relacionados