tecnologia

OpenAI transcribió un millón de horas de videos de Youtube

El diario asegura que OpenAI desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en en videos.

Nueva York | EFE | @panamaamerica - Actualizado:

La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de térmi

OpenAI creó un programa para transcribir más de un millón de horas de videos de Youtube con el objetivo de entrenar el modelo de generación de texto GPT-4, su modelo más avanzado abierto al público, según una exclusiva de The New York Times (NYT) publicada este sábado.

El diario asegura que OpenAI, una empresa sin ánimo de lucro, desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en videos para obtener datos de entrenamiento de modelos de generación de lenguaje, conocidos como LLM.

Las fuentes consultados por el NYT aseguran que el equipo encargado de Whisper incluía a Greg Brockman, presidente de OpenAI.

La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de términos de uso.

Según el artículo, OpenAI consideró que necesitaba más datos de entrenamiento en 2021 y discutió si obteneros de Youtube, podcast o audiolibros.

En una reciente entrevista el consejero ejecutivo de YouTube, Neal Mohan, aseguró que si OpenAI ha usado vídeos de la plataforma para entrenar 'Sora', su modelo de generación de vídeos realistas, estaría violando sus términos de servicio.

"Los creadores de contenido que vienen a Youtube tienen ciertas expectativas, entre ellas que los términos de servicio se cumplen. Nuestros términos permiten extraer cierto contenido como el título, el nombre de canal o el nombre del creador para facilitar la web abierta", explicó Mohan.

"No está permitido descargar las transcripciones o partes de los videos. Eso es una violación clara de nuestro términos de contenido", añadió el directivo.

La portavoz de OpenAI Lindsay Held indicó en una respuesta a la exclusiva obtenida por The Verge que la compañía crea bases de datos "únicas" y utiliza "numerosas fuentes disponibles públicamente y realiza acuerdos para obtener dato que no es público".

Google transcribe los videos de Youtube para obtener texto para alimentar a sus modelos de generación de texto, algo que violaría los derechos de los creadores que suben sus videos a la plataforma, según fuentes consultadas por el diario.

Los derechos sobre el contenido usado para entrenar modelos de Inteligencia Artificial aún no están bien definidos y la competitividad para conseguir los mejores modelos de generación de contenido realista está llevando a empujar las fronteras de la legalidad en derechos de autor.

El gigante tecnológico Meta, creador de Facebook, debatió el año pasado si comprar la editorial Simon & Schuster para obtener acceso a su material de largo formato, según el contenido de reuniones entre gerentes, abogados e ingenieros de la compañía a los que tuvo acceso el NYT.

Versión impresa
Etiquetas
Por si no lo viste
Regístrate para recibir contenido exclusivo
Más Noticias

Judicial Perito no halló ninguna operación sospechosa en su revisión contable a Ricamar; no hubo mal manejo de donaciones

Sociedad Un 56% de los colaboradores en Panamá se ha enamorado en el trabajo; el 10% se casó

Judicial Perito confirma que donaciones, con las que se pretende ligar a RM a Odebrecht, se usaron para pagar publicidad en medios

Sociedad Ministra del Mides convoca sesión extraordinaria para el lunes, tras nuevas denuncias de irregularidades en albergues

Sociedad 'Cholo' Chorrillo, declarado culpable de todos los delitos en su contra por una corte de Estados Unidos

Judicial ¿Fiscalía pretende condena con base en pruebas viciadas?

Provincias Irregularidades en utilización de espacios públicos en Arraiján

Economía Programa de pasantías no implicará un abuso en llenar las empresas de pasantes, advierte presidente de la CCIAP

Variedades Herminio Rojas celebra 40 años con el ‘hit’ del próximo Carnaval

Sociedad Detienen a conductor de busito en Panamá Este, tras accidente en el que murió una pasajera

Sociedad Más de 30,000 unidades de la fuerza pública cuidarán de los panameños en carnavales

Provincias Parque Nacional Chagres usará dron para cuidar esta área protegida

Mundo Zelenski asegura que Trump quiere poner fin a la guerra en junio

Provincias Un fin de semana con 'Sabores de Colón'

Variedades Bad Bunny apunta a romper el récord de 'show' latino más visto en el Super Bowl

Deportes Barcelona tiene un buen día en la liga tras vencer al Mallorca

Variedades 'Parking de Yen Video': ¿quién será el ganador?

Sociedad Clientes moroso con el Idaan arrojan cemento a los medidores para evitar cortes

Economía Arias propone que la Corte revise concesiones del Estado para evitar inconstitucionalidades

Judicial Genaro López recibe cambio de medida cautelar y deberá firmar semanalmente

Sociedad MiAmbiente publica tercer informe de avance de auditoría al proyecto Mina de Cobre Panamá

Deportes Michael Murillo, de Marsella a Turquía para firmar con el Besiktas

Sociedad Ciudad de la Salud realiza con éxito procedimiento para remover coágulos pulmonares

Suscríbete a nuestra página en Facebook