ChatGPT recibió una actualización para hacerlo parecer más humano – 7 minutos
Sei 203921743.jpg

El último modelo de OpenAI ofrece una experiencia conversacional más humana

Imagen JIYI / Alamy

OpenAI anunció su modelo de inteligencia artificial más nuevo, llamado GPT-4o, que pronto impulsará algunas versiones del producto ChatGPT de la compañía. El ChatGPT actualizado puede responder rápidamente a entradas de texto, audio y video de su interlocutor en tiempo real, todo mientras habla con inflexiones y palabras que transmiten un fuerte sentido de emoción y personalidad.

La compañía demostró la imitación emocional del nuevo modo de voz durante una presentación de OpenAI supuestamente en vivo, que presentó tanto la aplicación móvil ChatGPT como una nueva aplicación de escritorio, el 13 de mayo. Hablando con una voz que suena femenina y respondiendo al nombre ChatGPT, las capacidades conversacionales de la nueva IA parecían más parecidas a la agradable IA expresada por Scarlett Johansson en la película de ciencia ficción de 2013 «Ella» que a las respuestas más enlatadas y robóticas de la voz típica. tecnologías auxiliares.

«La nueva interacción de voz a voz del GPT-4o se asemeja más a la interacción entre humanos», dice Michelle Cohn en la Universidad de California, Davis. «Una gran parte de esto se debe a los cortos tiempos de espera… pero una parte aún mayor es el nivel de expresividad emocional que genera la voz».

Durante una conversación con la CTO de la empresa, Mira Murati, y otros dos empleados, el ChatGPT con tecnología GPT-4o aconsejó a Mark Chen de OpenAI sobre su respiración agitada y acelerada diciendo: «Vaya, más despacio, no eres una aspiradora» y luego sugiriendo un ejercicio de respiración. La IA también examinó visualmente un dibujo de Barret Zoph de OpenAI, que incluía palabras y un corazón, respondiendo en tonos efusivos: «Oh, veo que escribiste Me encanta ChatGPT, eso es muy dulce de tu parte».

El nuevo ChatGPT también instruyó verbalmente a sus interlocutores sobre cómo resolver una ecuación lineal simple, explicó la función del código de computadora e interpretó un gráfico que muestra las líneas de temperatura que alcanzan su punto máximo en los meses de verano. Cuando se le solicitaba, la IA incluso volvía a contar varias veces un cuento inventado antes de dormir mientras cambiaba entre narraciones cada vez más dramáticas y cantaba el final.

El nuevo modo de voz estará disponible por primera vez para los suscriptores pagos de ChatGPT Plus en las próximas semanas, dijo Sam Altman, director ejecutivo y cofundador de OpenAI, en un correo en el andén X.

ChatGPT pudo recuperarse de forma conversacional incluso de algún problema técnico ocasional. Cuando se le pide que interprete el expresiones faciales y emociones En una selfie de Zoph de OpenAI, la IA primero sugirió que estaba mirando una superficie de madera de una imagen anterior antes de que se le solicitara que evaluara la imagen más reciente.

«Ahh, ahí vamos: parece que te sientes muy feliz y alegre con una gran sonrisa y un toque de emoción», dijo ChatGPT. “Pase lo que pase, parece que estás de buen humor. ¿Te importaría compartir la fuente de esas buenas vibraciones?

Cuando le dijeron que era porque la demostración en vivo con ChatGPT mostraba lo «útil y sorprendente que eres», la IA respondió: «Basta, me estás haciendo sonrojar».

Pero Murati reconoció que la versión actualizada de ChatGPT impulsada por GPT-4o, que según la compañía eventualmente estará disponible incluso para los usuarios gratuitos de ChatGPT, conlleva nuevos riesgos de seguridad debido a la forma en que incorpora e interpreta información en tiempo real. Dijo que OpenAI ha estado trabajando para crear «mitigaciones contra el uso indebido».

«Tener conversaciones multimodales fluidas es realmente difícil, por eso las demostraciones son impresionantes», dice Pedro Henderson en la Universidad de Princeton en Nueva Jersey. «Pero a medida que se agregan más modalidades, la seguridad se vuelve mucho más difícil e importante; probablemente llevará algún tiempo identificar posibles modos de falla de seguridad con tal expansión de entradas que utiliza el modelo».

Henderson también se describió a sí mismo como «curioso» por ver los términos de privacidad de OpenAI una vez que los usuarios de ChatGPT comiencen a compartir información como audio y video en vivo, y si los usuarios gratuitos pueden optar por no participar en la recopilación de datos que pueden usarse para entrenar futuros modelos de OpenAI.

“Dado que el modelo parece estar alojado fuera del dispositivo, el hecho de que puedas compartir la pantalla de tu escritorio con el modelo a través de Internet o grabar audio o video continuamente parece aumentar el desafío para el lanzamiento de este producto en particular, si el plan es almacenar y utilizar esos datos”, dice Henderson.

Un chatbot con IA más antropomorfizado también representa otra amenaza: un robot que puede empatía falsa a través de conversaciones de voz podría sonar más agradable y persuasivo para las personas, según investigación estudios de Cohn y sus colegas. Esto aumenta el riesgo de que las personas estén más inclinadas a confiar potencialmente inexacto información y estereotipos prejuiciosos generado por grandes modelos de lenguaje como GPT-4.

«Esto tiene implicaciones importantes para la forma en que las personas buscan y reciben orientación de grandes modelos lingüísticos, particularmente porque no siempre generan información precisa», dice Cohn.

Temas: