OpenAI presenta Voice Engine, la riesgosa tecnología que clona voces
Voice Engine puede recrear la voz de una persona con sólo 15 segundos de grabación de su voz.
OpenAI, conocida por su desarrollo del popular ChatGPT, ha anunciado su incursión en el mercado de los asistentes virtuales con el lanzamiento de su última innovación: Voice Engine. Esta nueva tecnología promete clonar la voz de una persona con una precisión sorprendente, utilizando únicamente 15 segundos de grabación de audio como muestra.
El anuncio de OpenAI ha generado gran expectativa en la comunidad, ya que esta tecnología podría revolucionar la forma en que interactuamos con los asistentes virtuales. Sin embargo, la empresa ha sido cautelosa y ha declarado que por el momento no lanzará públicamente Voice Engine debido a preocupaciones de seguridad y ética.
OpenAI señala que planea previsualizarla con las primeras personas que la prueben, “pero no lanzar ampliamente esta tecnología en este momento” debido a los peligros de que se le dé un uso indebido.
“Reconocemos que generar habla que se parezca a las voces de las personas conlleva serios riesgos, los cuales hay que tomar en cuenta, especialmente en un año electoral”, dijo la empresa de San Francisco en un comunicado.
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024
En Nueva Hampshire, las autoridades investigan llamadas automáticas efectuadas a miles de votantes poco antes de las primarias presidenciales, en las cuales se escuchaba una voz generada por inteligencia artificial que imitaba la del presidente Joe Biden.
Una serie de empresas incipientes ya venden tecnología que clona voces, de la cual alguna ya es accesible al público o a clientes comerciales selectos, como estudios de entretenimiento.
OpenAI dice que las primeras personas que probaron Voice Engine acordaron no hacerse pasar por otra persona sin su consentimiento y divulgar que las voces son generadas por IA. La empresa, más conocida por su chatbot y el generador de imágenes DALL-E, adoptó una estrategia similar al anunciar su generador de video Sora, pero sin lanzarlo ampliamente.
🚨 BREAKING NEWS:
— God of Prompt (@godofprompt) March 29, 2024
OpenAI just released Voice Engine,
Provide text as input and a 15-second audio sample to copy the voice of the original speaker.
It sounds incredibly similar 🤯
Follow the 🧵 pic.twitter.com/CEUJtLbz8c
Sin embargo, la solicitud de marca registrada presentada el 19 de marzo muestra que es probable que OpenAI intente ingresar al negocio del reconocimiento del habla y de los asistentes virtuales. A la larga, mejorar dicha tecnología podría ayudar a OpenAI a competir con otros productos de voz similares, como Alexa de Amazon.
Con información de Reforma.