Spotify empezará a utilizar inteligencia artificial para traducir podcasts a otros idiomas, según anunció la empresa este lunes como parte de una asociación con OpenAI.
De esta forma, Spotify se convierte en la última compañía tech en utilizar IA generativa para sus productos.
Datos clave
Spotify anunció el lunes que va a lanzar un piloto de su función "Traducción de voz", que traducirá podcasts a otros idiomas que coincidirán con la voz y el estilo del locutor original.
La función se ha creado en colaboración con OpenAI, que anunció el lunes que lanzaba nuevas "capacidades de voz e imagen" para ChatGPT.
Las actualizaciones permitirán a los usuarios hablar con el chatbot de IA con un audio generado "similar al humano a partir de sólo texto y unos segundos de habla de muestra".
Spotify se basó en la herramienta de transcripción de voz Whisper de OpenAI, que transcribe el habla inglesa y traduce otros idiomas al inglés.
El piloto incluye tres episodios de podcasts -incluidos Lex Fridman, Armchair Expert y The Diary of a CEO con Steven Bartlett- disponibles en español tanto para usuarios suscritos como no suscritos, con episodios disponibles en francés y alemán.
Gran número: 100 millones. Esa es la cantidad de usuarios que escuchan "regularmente" podcasts en Spotify, según la empresa.
Todos los podcasts traducidos estarán disponibles en el "Voice Translations Hub" de Spotify, que se actualizará con episodios y podcasts adicionales “en las próximas semanas y meses”.
Tendencia
Otras empresas han empezado a utilizar la IA generativa para sus productos en los últimos meses.
Meta anunció a principios de año que lanzaría AudioCraft, una herramienta que permite a los usuarios crear música y sonidos generados por IA.
El Financial Times informó en agosto de que Google y Universal Music Group estaban en conversaciones sobre la posibilidad de conceder licencias de melodías y voces de artistas para la música generada por IA.
Google también anunció a principios de este mes que había integrado su chatbot Bard de IA en sus otras aplicaciones, como YouTube, Gmail y Drive.
En medio de las preocupaciones sobre la privacidad y la seguridad, OpenAI dijo que estaba liberando gradualmente sus capacidades de imagen y voz para ChatGPT.
Así lo anunció después de que la compañía advirtiera que las nuevas características podrían presentar nuevos riesgos, incluyendo "la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude".