Resemble AI, una plataforma que utiliza IA generativa para clonar voces que suenan realistas, anunció hoy que recaudó $ 8 millones en una ronda Serie A liderada por Javelin Venture Partners, con la participación de Craft Ventures y Ubiquity Ventures.
El tramo, que eleva el total recaudado por la startup a 12 millones de dólares, se destinará a seguir desarrollando los productos empresariales de Resemble y a duplicar el tamaño de su equipo a más de 40 personas para finales de año, dice el cofundador y director ejecutivo Zohaib Ahmed.
«Algunas de las empresas de medios más grandes del mundo están utilizando la tecnología de Resemble para crear contenido que antes era imposible», dijo Ahmed a TechCrunch en una entrevista por correo electrónico.
Resemble fue fundada en 2019 por Ahmed y Saqib Muhammad después de que los dos observaron que las voces en los videojuegos no podían mantenerse al día con las frecuentes actualizaciones de las versiones de los propios juegos. Ahmed trabajó anteriormente en Magic Leap como ingeniero de software líder, recién salido de BlackBerry y Hipmunk.
Resemble comenzó poco a poco, centrándose principalmente en casos de uso de juegos. Pero la plataforma creció para ofrecer tecnología de inteligencia artificial que puede «transferir» voces a otros idiomas, generar mensajes personalizados de actores de voz y crear agentes conversacionales en tiempo real.
Resemble es solo un actor en el mercado de rápido crecimiento de la IA de voz generativa. Papercup, Deepdub, ElevenLabs, Respeecher, Acapela y Voice.ai se encuentran entre los proveedores de startups más destacados que ofrecen herramientas de inteligencia artificial para clonar y generar voces, sin mencionar a las grandes empresas tecnológicas como AWS, Azure y Google Cloud.
Sin embargo, es una tecnología controvertida, y no sin una buena razón.
Placa base escribe sobre cómo a los actores de doblaje se les pide cada vez más que cedan los derechos de sus voces, para que los clientes puedan aprovechar la IA para generar versiones sintéticas que eventualmente podrían reemplazarlas, a veces sin compensación.
Los deepfakes son otro problema.
Los actores maliciosos están utilizando la IA para clonar las voces de las personas, engañando a las víctimas haciéndoles creer que están hablando con un familiar o un cliente. Y no es sólo el potencial criminal lo que hace saltar las alarmas. En 2021, un documentalista fue criticado por contratar una empresa para clonar póstumamente la voz de Anthony Bourdain, con el consentimiento de los herederos de Bourdain. En los años transcurridos, los deepfakes de voz se han apoderado de las redes sociales, en su mayoría con efectos inofensivos, pero a veces no.
Sin embargo, Ahmed afirma que Resemble se destaca en el área de la ética.
«Además de exigir el consentimiento explícito del usuario para clonar voces, se aplican pautas de uso estrictas para evitar el uso malicioso», dijo.
Con este fin, Resemble requiere que los usuarios proporcionen una grabación de un «clip de consentimiento» en la voz que están intentando clonar. Si la voz en el clip no coincide con los otros clips, Resemble impide que el usuario cree la voz de IA.
Además, para evitar un mal uso al grabar, Resemble obliga a los usuarios a decir una serie de frases específicas con su propia voz. Si se desvían del guión, Resemble marca la grabación como posible uso indebido.
«Una vez creada la voz, el usuario posee todos los derechos sobre esa voz», dijo Ahmed. “No utilizamos esos datos de voz para entrenar otros modelos, ni revendemos los datos de voz a empresas de terceros… Para soluciones personalizadas, trabajamos con empresas a través de un proceso riguroso para asegurarnos de que la voz que están clonando sea utilizable. por ellos y contar con los consentimientos adecuados con los actores de doblaje”.
Resemble también ha desarrollado un producto, Resemble Detect, que está diseñado para validar la autenticidad de los datos de audio utilizando un modelo de inteligencia artificial entrenado para distinguir el audio falso del real. Básicamente, el modelo «ve» diferentes frecuencias donde podrían estar contenidos los artefactos resultantes de la edición o manipulación del sonido, haciendo una predicción de 0% a 100% de confianza en cuanto a la «realidad» del clip.
Detect está destinado a complementar la tecnología de marcas de agua de audio de Resemble, PerTh Watermarker, que utiliza un modelo de inteligencia artificial para producir e insertar tonos de audio imperceptibles para el oído humano que contienen información de identificación. (Vale la pena señalar que PerTh Watermarker es una especie de juego de bloqueo de plataforma: solo puede marcar y detectar el habla generada por Resemble y no es compatible con otras herramientas de inteligencia artificial de generación de voz comerciales o de código abierto).
Ahmed considera que estas herramientas contribuyen de manera importante al éxito de Resemble. La plataforma tiene más de un millón de usuarios, afirma, que han generado 35 años de audio en los últimos 12 meses.
«Dado que la regulación de la IA es una prioridad para los funcionarios gubernamentales, Resemble proporciona ideas y recomendaciones sobre el uso responsable del audio generativo», dijo Ahmed. «Con Resemble, crear contenido de voz atractivo y de alta calidad ahora es más fácil que nunca, lo que permite a los creadores de contenido agregar un nivel completamente nuevo de autenticidad a su trabajo y agregará un nuevo nivel de inmersión para la audiencia».
Pcenter.es – #plataforma #clonación #voz #Resemble #obtiene #millones #dólares
Síguenos en YouTube: @PCenterES