La nueva función ‘DJ’ de Spotify es el primer paso hacia el futuro impulsado por la IA del transmisor

por admin

Spotify tiene planes más grandes para la tecnología detrás de su nueva función AI DJ después de ver una reacción positiva de los consumidores a la nueva función. Lanzado justo antes del evento Stream On de la compañía en Los Ángeles la semana pasada, AI DJ selecciona una selección personalizada de música combinada con comentarios hablados entregados con una voz realista generada por IA. Pero en el fondo, la función aprovecha lo último en tecnologías de inteligencia artificial y grandes modelos de lenguaje, así como voz generativa, todo lo cual se suma a las inversiones existentes de Spotify en personalización y aprendizaje automático.

Spotify cree que estas nuevas herramientas no necesariamente tienen que limitarse a una sola característica, razón por la cual ahora está experimentando con otras aplicaciones de la tecnología.

Aunque lo más destacado del evento Stream On de Spotify fue la renovación de la aplicación móvil, que ahora se centra en feeds de descubrimiento similares a TikTok para música, podcasts y audiolibros, AI DJ es ahora una parte destacada de la nueva experiencia del servicio de streaming. Presentado a finales de febrero para los suscriptores Premium de Spotify en EE. UU. y Canadá, el DJ está diseñado para conocer tan bien a los usuarios que podría reproducir lo que quisieran escuchar con solo presionar un botón.

Con la renovación de la aplicación, el DJ aparecerá en la parte superior de la pantalla debajo del subcanal Música para los suscriptores, lo que servirá como una forma sencilla de transmitir su música favorita y como un medio para impulsar a los usuarios gratuitos a actualizar.

Para crear el comentario que acompaña la música que transmite el DJ, Spotify dice que aprovechó la base de conocimientos y las ideas de sus propios expertos en música internos. Utilizando la tecnología de IA generativa de OpenAI, el DJ puede escalar sus comentarios a los usuarios finales de la aplicación. Y a diferencia de ChatGPT, que intenta crear respuestas extrayendo información encontrada en la web, la base de datos más limitada de conocimiento musical de Spotify garantiza que los comentarios del DJ terminen siendo relevantes y precisos.

Las selecciones de música reales elegidas por el DJ provienen de su comprensión actual de los gustos e intereses del usuario, reflejando lo que antes se habría programado en listas de reproducción personalizadas, como Discover Weekly y otras.

Mientras tanto, la voz del AI DJ se creó utilizando tecnología que Spotify adquirió de Sonatic el año pasado y se basa en la del director de Asociaciones Culturales de Spotify, Xavier “X” Jernigan, presentador del ahora desaparecido podcast matutino de Spotify, “The Get Up”. Sorprendentemente, la voz suena increíblemente realista y nada robótica. (Durante el evento en vivo de Spotify, Jernigan habló junto a su doble de IA y las diferencias fueron difíciles de detectar. «Puedo escuchar mi voz todo el día», bromeó).

“La razón por la que suena tan bien es en realidad el objetivo de la tecnología Sonatic, el equipo que adquirimos. Se trata de la emoción en la voz”, explica el jefe de personalización de Spotify, Ziad Sultan, en una conversación con TechCrunch después de finalizar Stream On. “Cuando escuches al AI DJ, escucharás dónde está la pausa para respirar. Escucharás las diferentes entonaciones. Se puede escuchar entusiasmo por ciertos tipos de géneros”, dice.

Por supuesto, una voz de IA con sonido natural no es nueva: Google cautivó al mundo con su propia creación de IA con sonido humano hace años. Pero su implementación dentro de Duplex generó críticas, ya que la IA llamaba a las empresas en nombre del usuario final, inicialmente sin revelar que no era una persona real. No debería haber una preocupación similar con la función de Spotify, dado que incluso se le llama «AI DJ».

Para que la voz de IA de Spotify suene natural, Jernigan fue al estudio para producir grabaciones de voz de alta calidad, mientras trabajaba con expertos en tecnología de voz. Allí, se le indicó que leyera varias líneas utilizando diferentes emociones, que luego se introducen en el modelo de IA. Spotify no dijo cuánto tiempo lleva este proceso ni detalló los detalles, señalando que la tecnología está evolucionando y refiriéndose a ella como su «salsa secreta».

“A partir de esa información de alta calidad que tiene muchas permutaciones diferentes, [Jernigan] luego ya no necesita decir nada, ahora es puramente generada por IA”, dice Sultan sobre la voz generada. Aún así, Jernigan a veces aparece en la sala de escritores de Spotify para ofrecer comentarios sobre cómo leyó una línea para asegurarse de tener aportes continuos.

Créditos de imagen: Captura de pantalla de Spotify

Pero si bien AI DJ se construye utilizando una combinación de tecnología Sonantic y OpenAI, Spotify también está invirtiendo en investigaciones internas para comprender mejor lo último en inteligencia artificial y grandes modelos de lenguaje.

«Tenemos un equipo de investigación que trabaja en los últimos modelos de lenguaje», le dice Sultan a TechCrunch. De hecho, tiene unos cientos trabajando en personalización y aprendizaje automático. En el caso de AI DJ, el equipo está utilizando el modelo OpenAI, señala Sultan. “Pero, en general, contamos con un gran equipo de investigación que comprende todas las posibilidades de los grandes modelos de lenguaje, de la voz generativa y de la personalización. Esto va muy rápido”, afirma. «Queremos ser conocidos por nuestra experiencia en IA».

Sin embargo, Spotify puede utilizar o no su propia tecnología interna de inteligencia artificial para impulsar desarrollos futuros. Puede decidir que tiene más sentido trabajar con un socio, como lo está haciendo ahora con OpenAI. Pero es demasiado pronto para decirlo.

«Publicamos artículos constantemente», dice Sultan. “Invertiremos en las últimas tecnologías; como se puede imaginar, en esta industria, los LLM son esa tecnología. Por eso desarrollaremos la experiencia”.

Con esta tecnología fundamental, Spotify puede avanzar en otras áreas que involucran IA, LLM y tecnología de IA generativa. En cuanto a cuáles podrían ser esas áreas en términos de productos de consumo, la compañía aún no lo dice. (Hemos oído que un chatbot similar a ChatGPT se encuentra entre las opciones con las que se está experimentando. Pero no hay nada decidido en términos de lanzamiento, ya que es un experimento entre muchos otros).

“No hemos anunciado los planes exactos sobre cuándo podríamos expandirnos a nuevos mercados, nuevos idiomas, etc. Pero es una tecnología que es una plataforma. Podemos hacerlo y esperamos compartir más a medida que evolucione”, afirma Sultan.

Los primeros comentarios de los consumidores sobre la IA son prometedores, dice Spotify

La empresa no quería desarrollar un conjunto completo de productos de IA porque no estaba segura de cuál sería la reacción de los consumidores ante el DJ. ¿La gente querría un DJ con IA? ¿Se involucrarían con la función? Nada de eso estaba claro. Después de todo, el asistente de voz de Spotify (“Hey Spotify”) había sido cancelado por falta de adopción.

Pero hubo señales tempranas de que la función de DJ podría funcionar bien. Spotify había probado el producto internamente entre los empleados antes de su lanzamiento, y las métricas de uso y reintegración habían sido «muy, muy buenas».

La adopción pública, hasta ahora, coincide con lo que Spotify vio internamente, nos dice Sultan. Eso significa que existe potencial para desarrollar productos futuros utilizando las mismas bases subyacentes.

“La gente pasa horas al día con este producto… les ayuda a elegir, a descubrir, les narra la siguiente música que deberían escuchar y les explica por qué… entonces la reacción: si consulta varias redes sociales, verá «Veremos que es muy positivo y emotivo», dice Sultan.

Además, Spotify compartió que, en los días que los usuarios sintonizaron, pasaron el 25% de su tiempo escuchando con el DJ, y más de la mitad de los oyentes por primera vez volvieron a usar la función al día siguiente. Sin embargo, estas métricas son tempranas, ya que la función aún no se ha implementado al 100 % en EE. UU. y Canadá. Pero, según la empresa, son prometedores.

«Creo que es un paso sorprendente en la construcción de una relación entre productos y usuarios realmente valiosos», afirma Sultan. Pero advierte que el desafío que tenemos por delante será «encontrar la aplicación adecuada y luego construirla correctamente».

“En este caso, dijimos que se trataba de un DJ de música con IA. Creamos la sala de escritores para ello. Lo ponemos en manos de los usuarios para que hagan exactamente el trabajo para el que estaban destinados. Está funcionando súper bien. Pero definitivamente es divertido soñar con qué más podríamos hacer y qué tan rápido podríamos hacerlo”, añade.

Pcenter.es – #nueva #función #Spotify #primer #paso #hacia #futuro #impulsado #por #del #transmisor

Síguenos en YouTube: @PCenterES

También le puede interesar

Deja un comentario

Por favor, permite que se muestren anuncios en nuestro sitio web

Parece que estás usando un bloqueador de anuncios. Dependemos de la publicidad para financiar nuestro sitio web.