tecnologia

OpenAI transcribió un millón de horas de videos de Youtube

El diario asegura que OpenAI desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en en videos.

Nueva York | EFE | @panamaamerica - Actualizado:

La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de térmi

OpenAI creó un programa para transcribir más de un millón de horas de videos de Youtube con el objetivo de entrenar el modelo de generación de texto GPT-4, su modelo más avanzado abierto al público, según una exclusiva de The New York Times (NYT) publicada este sábado.

El diario asegura que OpenAI, una empresa sin ánimo de lucro, desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en videos para obtener datos de entrenamiento de modelos de generación de lenguaje, conocidos como LLM.

Las fuentes consultados por el NYT aseguran que el equipo encargado de Whisper incluía a Greg Brockman, presidente de OpenAI.

La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de términos de uso.

Según el artículo, OpenAI consideró que necesitaba más datos de entrenamiento en 2021 y discutió si obteneros de Youtube, podcast o audiolibros.

En una reciente entrevista el consejero ejecutivo de YouTube, Neal Mohan, aseguró que si OpenAI ha usado vídeos de la plataforma para entrenar 'Sora', su modelo de generación de vídeos realistas, estaría violando sus términos de servicio.

"Los creadores de contenido que vienen a Youtube tienen ciertas expectativas, entre ellas que los términos de servicio se cumplen. Nuestros términos permiten extraer cierto contenido como el título, el nombre de canal o el nombre del creador para facilitar la web abierta", explicó Mohan.

"No está permitido descargar las transcripciones o partes de los videos. Eso es una violación clara de nuestro términos de contenido", añadió el directivo.

La portavoz de OpenAI Lindsay Held indicó en una respuesta a la exclusiva obtenida por The Verge que la compañía crea bases de datos "únicas" y utiliza "numerosas fuentes disponibles públicamente y realiza acuerdos para obtener dato que no es público".

Google transcribe los videos de Youtube para obtener texto para alimentar a sus modelos de generación de texto, algo que violaría los derechos de los creadores que suben sus videos a la plataforma, según fuentes consultadas por el diario.

Los derechos sobre el contenido usado para entrenar modelos de Inteligencia Artificial aún no están bien definidos y la competitividad para conseguir los mejores modelos de generación de contenido realista está llevando a empujar las fronteras de la legalidad en derechos de autor.

El gigante tecnológico Meta, creador de Facebook, debatió el año pasado si comprar la editorial Simon & Schuster para obtener acceso a su material de largo formato, según el contenido de reuniones entre gerentes, abogados e ingenieros de la compañía a los que tuvo acceso el NYT.

Versión impresa
Etiquetas
Por si no lo viste
Regístrate para recibir contenido exclusivo
Más Noticias

Deportes La Copa América de Béisbol en Panamá fue cancelada por la WBSC

Sociedad Martinelli pide investigar cómo Gaby Carrizo se 'apropió' de un penthouse propiedad de Taher Yaafar

Deportes Panamá va con la mejor actitud ante Paraguay en el Mundial Sub-17 de Catar 2025

Judicial Juicio del caso Odebrecht será en el 2026

Sucesos Capturan a tres por delito de estafa en Panamá Oeste

Deportes Gimnasia panameña se lleva 14 medallas en el Panamericano Infantil y Juvenil de El Salvador

Provincias Declaraciones del alcalde de Colón sobre impuestos municipales generan reacciones

Economía BDA traspasa propiedades al Mida y la Dirección General de Ingresos

Deportes Gimnasia panameña se lleva 14 medallas en el Panamericano Infantil y Juvenil de El Salvador

Economía Chiquita anuncia ferias de reclutamiento en Changuinola

Provincias Portobeleños están desaparecidos en altamar y autoridades no dan respuestas

Sociedad Autoridades atienden denuncia ambiental sobre el río Matasnillo

Variedades 'Balbinín' y su 'novela turca': ¿amor o interés?

Economía Crece el interés internacional en los bonos de Panamá

Provincias Trabajos de restauración a instalaciones históricas en Portobelo afectada por mal tiempo

Política RM a sus diputados en el Parlacen: 'Votan a favor y se les revoca el mandato'

Sucesos Lesiones personales, el delito de más alto crecimiento

Provincias Aduanas incautó en Colón mercancía valorada en más de 7 mil dólares

Sucesos Protestas por aumento de pasaje paralizan a la isla de Taboga

Sociedad Placas y calcomanías del mes de noviembre de 2025 ya están listas

Política Olaciregui: Varela aún tiene fichas claves en el MP y la Corte Suprema

Variedades Mirna Caballini deslumbra en preliminares de Miss Universo 2025

Variedades Brad Pitt demandó a Angelina Jolie por $35 millones, según People

Sociedad Minsa enumera las anomalías encontradas en los puestos de venta de comida durante los desfiles

Deportes Ex NFL es extraditado a EE.UU. para enfrentar juicio por intento de asesinato

Provincias Seguridad del hospital de Soná resulta herido tras ser atacado por un hombre que exigía atención médica

Provincias Dictan detención provisional para acusado de mortal ataque a cuchilladas en Donoso

Sociedad Obras más costosas es el precio de la demora en proyectos sociales

Deportes Christiansen quiere ver en el terreno de juego a un equipo panameño con hambre

Suscríbete a nuestra página en Facebook