Youtuber demanda a OpenAI por utilizar datos sin consentimiento para ‘alimentar’ a ChatGPT

Noticias
/ 5 agosto 2024

Se ha acusado a OpenAI de usar transcripciones de millones de videos de YouTube para entrenar sus modelos de IA sin notificación ni compensación a los creadores

El pasado viernes, 2 de agosto, un creador de contenido de YouTube presentó una denuncia ante el Tribunal de Distrito de Estados Unidos para el Distrito Norte de California, acusando a OpenAI de utilizar transcripciones de millones de videos de YouTube para entrenar sus modelos de inteligencia artificial (IA) generativa sin notificar ni compensar a los propietarios de los videos.

El demandante, conocido como Millette, alega que OpenAI transcribió sus videos y los de otros creadores para entrenar los modelos que impulsan ChatGPT, así como otras herramientas y productos de IA generativa. Los abogados de Millette argumentan que OpenAI se ha “beneficiado significativamente” del trabajo de los creadores de contenido sin su consentimiento.

TE PUEDE INTERESAR: ¿Es capaz la Inteligencia Artificial de prevenir los problemas de salud mental?

DATOS QUE FUERON UTILIZADOS PARA ENTRENAR A CHATGPT FUERON COPIADOS SIN CONSENTIMIENTOS DE LOS AUTORES

La demanda sostiene que esta acción infringe los derechos de autor y los términos de servicio de YouTube, que prohíben el uso del contenido de la plataforma para aplicaciones independientes sin autorización. “Gran parte del material de los conjuntos de datos de entrenamiento de OpenAI proviene de trabajos que fueron copiados por OpenAI sin consentimiento, sin crédito y sin compensación”, afirma la denuncia.

Los abogados de Millette buscan llevar el caso a juicio y obtener más de cinco millones de dólares en compensación por los daños ocasionados a los usuarios y creadores de contenido de YouTube.

POR QUÉ OPENAI UTILIZÓ VIDEOS DE YOUTUBE PARA ENTRENAR A SU IA

La demanda surge tras una investigación publicada por The New York Times en abril, que reveló que a finales de 2021 OpenAI se había quedado sin datos suficientes para continuar entrenando su modelo de IA, ChatGPT. En respuesta, los ingenieros de OpenAI desarrollaron Whisper, un modelo de IA con la capacidad de transcribir el audio de los videos de YouTube, lo que les permitió seguir entrenando su sistema de IA.

Sin embargo, esta actividad se considera una infracción de los derechos de YouTube. Lindsay Held, portavoz de OpenAI, declaró a The Verge que “la empresa selecciona conjuntos de datos ‘únicos’ para cada uno de sus modelos para ‘ayudar a su comprensión del mundo’ y mantener su competitividad en materia de investigación global”.

Agregó que OpenAI utiliza “numerosas fuentes, incluidos datos disponibles públicamente y asociaciones para datos no públicos”, y mencionó que la empresa estaba estudiando la posibilidad de generar sus propios datos sintéticos.

Prácticas de Otras Empresas

No solo OpenAI ha estado involucrada en este tipo de actividades. El informe del Times también señaló que Google ha recopilado transcripciones de YouTube para entrenar sus propios modelos de IA. Sin embargo, Matt Bryan, portavoz de Google, aseguró que han entrenado sus modelos con “algunos contenidos de YouTube, de acuerdo con nuestros acuerdos con los creadores de YouTube”.

Hasta el momento, OpenAI no ha emitido ningún comentario respecto a la demanda colectiva presentada por Millette. El caso promete ser un punto de inflexión en la discusión sobre el uso de contenido en línea para el entrenamiento de modelos de IA y los derechos de los creadores en la era digital.

Esta situación resalta la creciente tensión entre las empresas tecnológicas y los creadores de contenido en torno al uso de datos y la propiedad intelectual en el desarrollo de inteligencia artificial.

TE PUEDE INTERESAR: Expertos alertan por el aumento de la usurpación y la extorsión usando herramientas de IA

GOOGLE TAMBIÉN HABRÍA UTILIZADO LA TRANSCRIPCIÓN DE VIDEOS DE YOUTUBE BAJO ACUERDOS

No solo OpenAI ha estado involucrada en este tipo de actividades. El informe del Times también señaló que Google ha recopilado transcripciones de YouTube para entrenar sus propios modelos de IA. Sin embargo, Matt Bryan, portavoz de Google, aseguró que han entrenado sus modelos con “algunos contenidos de YouTube, de acuerdo con nuestros acuerdos con los creadores de YouTube”.

Hasta el momento, OpenAI no ha emitido ningún comentario respecto a la demanda colectiva presentada por Millette. El caso promete ser un punto de inflexión en la discusión sobre el uso de contenido en línea para el entrenamiento de modelos de IA y los derechos de los creadores en la era digital.

Esta situación resalta la creciente tensión entre las empresas tecnológicas y los creadores de contenido en torno al uso de datos y la propiedad intelectual en el desarrollo de inteligencia artificial.

Con información de EL UNIVERSAL

COMENTARIOS

Selección de los editores