ChatGPT comienza a lanzar el modo avanzado de chat de voz

Mojahid Mottakin/Unsplash

OpenAI ha comenzado a lanzar el modo de chat de voz avanzado de ChatGPT, ofreciendo a suscriptores selectos del plan ChatGPT Plus la capacidad de interactuar con respuestas de audio generadas por el modelo GPT-4o.

  • Haz clic y sigue a Canaltech en WhatsApp
  • Cómo hablar con ChatGPT | Chatear por voz

La primera versión de la función llega inicialmente a un grupo restringido de usuarios y se espera que la expansión llegue a todos los suscriptores Plus para fines de 2024.

Modo de voz avanzado en ChatGPT

El modo de voz avanzado con el modelo GPT-4o se presentó al público en mayo de este año, en el evento Spring Update de OpenAI, que destacó la capacidad de la función para generar respuestas de audio en una interacción que se asemeja a una conversación natural.

El nuevo modo de conversación de ChatGPT se diferencia por integrar la función de voz en un único modelo multimodal, lo que reduce la latencia en las respuestas. Además, la tecnología promete identificar matices emocionales en las voces de los usuarios, como tristeza y entusiasmo, mejorando la calidad de la interacción.

Los suscriptores seleccionados para probar la versión alfa de la función recibirán una notificación en la aplicación de ChatGPT, acompañada de un correo electrónico con instrucciones sobre cómo activar y probar la función. Según la empresa, el lanzamiento gradual tiene como objetivo controlar la eficacia de la herramienta.

¡Canaltech está en WhatsApp!Únete al canal y sigue noticias y consejos de tecnología.
Whatsapp

OpenAI informó que desde la demostración inicial, el modo de voz avanzado ha sido probado por más de 100 evaluadores externos, en 45 idiomas diferentes. Se espera que a principios de agosto se publique un informe detallado sobre estas pruebas de seguridad.

Voces modelo

En esta fase inicial del lanzamiento de la función, el modo de conversación avanzado de ChatGPT tendrá cuatro voces preestablecidas (Juniper, Breeze, Cove y Ember) creadas en colaboración con actores de doblaje profesionales.

Durante la demostración de la herramienta en el evento de mayo, una de las voces utilizadas generó polémica por su parecido con la voz de la actriz Scarlett Johansson. Después de la reacción violenta, OpenAI eliminó esta voz específica del modelo.

La compañía destacó que ChatGPT no podrá imitar las voces de personas reales, ya sean celebridades o individuos comunes y corrientes, y bloqueará cualquier intento de generar resultados distintos de las voces autorizadas.

Además, OpenAI dijo que ha implementado filtros para bloquear solicitudes para generar música u otro contenido protegido por derechos de autor, en respuesta a los recientes desafíos legales que enfrentaron las empresas de inteligencia artificial.

Vea también cómo se recopilan datos en la web para desarrollar IA.

Subir