El nuevo sistema de OpenAI, GPT-4o, puede escuchar, hablar y observar

Guardar

Artificial IntelligenceChatGPTComputers and the InternetSoftwareGoogle IncOpenAI LabsMurati, Mira

El nuevo chatbot de ChatGPT ya no es un mosaico de tres tecnologías, sino una más eficiente que acepta y genera textos, sonidos e imágenes.

Mientras Apple y Google transforman sus asistentes de voz en chatbots, OpenAI está transformando su chatbot en un asistente de voz.

El lunes, la empresa emergente de inteligencia artificial de San Francisco presentó una nueva versión de su chatbot ChatGPT que puede recibir y responder a comandos de voz, imágenes y videos.

La empresa afirmó que la nueva aplicación --basada en un sistema de inteligencia artificial llamado GPT-4o-- lidia con audio, imágenes y video mucho más rápido que la versión anterior de la tecnología. La aplicación estará disponible a partir del lunes, de forma gratuita, tanto para celulares como para computadoras de escritorio.

"Estamos estudiando el futuro de la interacción entre nosotros y las máquinas", afirmó Mira Murati, directora de tecnología de la empresa.

La nueva aplicación forma parte de un esfuerzo más amplio por combinar chatbots conversacionales como ChatGPT con asistentes de voz como el Asistente de Google y Siri de Apple. Mientras Google fusiona su chatbot Gemini con el Asistente de Google, Apple está preparando una nueva versión de Siri más conversacional.

OpenAI dijo que compartiría gradualmente la tecnología con los usuarios "en las próximas semanas". Es la primera vez que ofrece ChatGPT como aplicación de escritorio.

Anteriormente, la empresa ofrecía tecnologías similares desde el interior de varios productos gratuitos y de pago. Ahora, las ha integrado en un único sistema disponible en todos sus productos.

En un acto emitido en directo por internet, Murati y sus colegas mostraron cómo la nueva aplicación respondía a comandos de voz conversacionales, utilizaba una señal de video en directo para analizar problemas matemáticos escritos en una hoja de papel y leía en voz alta historias lúdicas que había escrito sobre la marcha.

La nueva aplicación no puede generar video. Pero puede generar imágenes fijas que representan fotogramas de un video.

Con el debut de ChatGPT a finales de 2022, OpenAI demostró que las máquinas pueden gestionar peticiones de forma más parecida a las personas. En respuesta a mensajes de texto conversacionales, pudo responder a preguntas, redactar trabajos e incluso generar código informático.

ChatGPT no se guiaba por un conjunto de reglas. Aprendió sus habilidades analizando enormes cantidades de texto extraído de internet, incluidos artículos de Wikipedia, libros y registros de chat. Los expertos elogiaron esta tecnología como posible alternativa a motores de búsqueda como Google y asistentes de voz como Siri.

Las versiones más recientes de la tecnología también han aprendido de sonidos, imágenes y videos. Los investigadores lo llaman "IA multimodal". Esencialmente, empresas como OpenAI empezaron a combinar chatbots con generadores de imágenes, audio y videos de inteligencia artificial.

(The New York Times demandó a OpenAI y a su socio, Microsoft, en diciembre, alegando infracción de derechos de autor de contenidos de noticias relacionados con sistemas de inteligencia artificial).

A medida que las empresas combinan chatbots con asistentes de voz, quedan muchos obstáculos por superar. Como los chatbots aprenden sus habilidades a partir de datos de internet, son propensos a cometer errores. A veces, se inventan información por completo, un fenómeno que los investigadores de IA llaman "alucinación". Esos fallos se están trasladando a los asistentes de voz.

Aunque los chatbots pueden generar un lenguaje convincente, son menos hábiles a la hora de realizar acciones como programar una reunión o reservar un vuelo. Pero empresas como OpenAI están trabajando para transformarlos en "agentes de IA" capaces de realizar esas tareas de forma fiable.

OpenAI ofrecía antes una versión de ChatGPT que podía aceptar órdenes vocales y responder con la voz. Pero se trataba de un mosaico de tres tecnologías de inteligencia artificial diferentes: una que convertía la voz en texto, otra que generaba una respuesta escrita y otra que convertía este texto en una voz sintética.

La nueva aplicación se basa en una sola tecnología IA --la GPT-4o-- capaz de aceptar y generar texto, sonidos e imágenes. Esto significa que la tecnología es más eficiente, y la empresa puede permitirse ofrecerla a los usuarios de forma gratuita, dijo Murati.

"Antes, toda esta latencia era el resultado de tres modelos trabajando juntos", dijo Murati en una entrevista con el Times. "Quieres tener la experiencia que estamos teniendo --donde podemos tener este diálogo muy natural".

Cade Metz es corresponsal tecnológico y cubre inteligencia artificial, coches autónomos, robótica, realidad virtual y otras áreas emergentes. Más de Cade Metz

La nueva aplicación forma parte de un esfuerzo amplio de combinar chatbots conversacionales como ChatGPT de OpenAI con asistentes de voz como el Asistente de Google y Siri de Apple. (Jason Henry/The New York Times)

New York Times BC OPENAI CHATBOT APP ART NYT

Últimas Noticias

Tintoretto, el genial y extravagante pintor que llenó de oscuridad al Renacimiento

Se cumplen 430 años de la muerte del artista veneciano, quien con su estilo dio inicio al barroco. Un repaso por su vida y obras permiten apreciar aquello que Virginia Woolf llamó un “inteligente poder”

Roberto Ampuero: “América latina se ha dejado seducir por los caudillos y siempre termina mal”

En su novela “Nunca volveré a Berlín”, el escritor y ex canciller chileno revive sus experiencias en Alemania Oriental y Cuba, a la vez que reflexiona sobre los vaivenes políticos y sociales de nuestro continente

Comenzó el registro de candidatos para las elecciones presidenciales anticipadas de Irán

La repentina muerte de Ebrahim Raisi, considerado en su día como posible sucesor del ayatolá Alí Jamenei ha desencadenado una carrera entre los partidarios de línea dura para influir en la elección del próximo líder

Crisis en Haití: cinco millones de personas están en peligro por una temporada de huracanes “inusualmente” activa

Residentes de Puerto Príncipe y Cité Soleil, que ya están sufriendo la prolongada violencia de las pandillas, se están viendo obligados a desplazarse a zonas rurales

Europa está en alerta ante posibles sabotajes e incendios provocados por Rusia

En una cumbre de ministros de Asuntos Exteriores y de Defensa celebrada en Bruselas, los funcionarios de seguridad holandeses, estonios y lituanos advirtieron sobre las vulnerabilidades nacionales ante los presuntos ataques del Kremlin

Temas Relacionados

Últimas Noticias

Tintoretto, el genial y extravagante pintor que llenó de oscuridad al Renacimiento

Roberto Ampuero: “América latina se ha dejado seducir por los caudillos y siempre termina mal”

Comenzó el registro de candidatos para las elecciones presidenciales anticipadas de Irán

Crisis en Haití: cinco millones de personas están en peligro por una temporada de huracanes “inusualmente” activa

Europa está en alerta ante posibles sabotajes e incendios provocados por Rusia

Venezuela

Un opositor venezolano advirtió que suspender la observación electoral de la UE es un “retroceso”

Estados Unidos instó a Venezuela a permitir el trabajo de los observadores electorales de la Unión Europea

Adultos mayores protestaron en Venezuela contra la “pensión de hambre”: menos de 4 dólares por mes

Los venezolanos están ahorrando dinero para invertirlo tras las elecciones o para irse del país si Nicolás Maduro es reelegido

Familiares de venezolanos desaparecidos exigieron una investigación a la Fiscalía General

México

Sentencian en EEUU a un hombre que usó un mensaje del Cártel del Golfo para intimidar a testigos

Por qué Ana Gabriela Guevara se negó a dar pronóstico de medallas para París 2024

Lotería Nacional: dónde ver el Gana Gato en vivo y la lista de ganadores

Este es el precio que Tigres le puso a Sebastián Córdova

Horacio Villalobos destrozó ‘¿Quién lo mató?’ serie sobre el asesinato de Paco Stanley: “Un horror”

COLOMBIA

Temblor en Colombia el jueves 30 de mayo 2024: sismos reportados por el Servicio Geológico Colombiano

Así funcionó la movilidad en las vías de Bogotá el 30 de mayo

Julio César Herrera reveló la odisea que vivió en grabación de escena de ‘Yo soy Betty la Fea’: “Sufrí mucho”

Usuarios de Transfiya deberán estar atentos al límite de dinero que pueden recibir: acá le contamos los topes

Karol G afrontaría grave problema en su presentación en el estadio Santiago Bernabéu: esta es la razón

ÚLTIMAS NOTICIAS

Alejandro Rúa: “El atentado a la AMIA es una tragedia que pasa desde hace 30 años, todavía hoy”

Martín Menem: “El mejor avance en la lucha contra la corrupción es achicar el Estado”

Cuándo y dónde será el último adiós a Nora Cortiñas, referente de la lucha por los derechos humanos

Tintoretto, el genial y extravagante pintor que llenó de oscuridad al Renacimiento

Roberto Ampuero: “América latina se ha dejado seducir por los caudillos y siempre termina mal”

INFOBAE AMÉRICA

Tintoretto, el genial y extravagante pintor que llenó de oscuridad al Renacimiento

Cuáles son las posibles sentencias contra Trump después de la condena en su contra, según expertos en Derecho

Pronóstico del estado del tiempo: las temperaturas que se esperan en Zaragoza este 31 de mayo

Roberto Ampuero: “América latina se ha dejado seducir por los caudillos y siempre termina mal”

Resultados de EuroDreams de este 30 de mayo

ENTRETENIMIENTO

Cordialmente Invitados: todo lo que sabemos de la nueva comedia de Prime Video con Reese Witherspoon

De ‘Rick y Morty’ a ‘Robot Chicken’: series animadas irreverentes para ver en streaming

La razón por la que Jeremy Renner abandonó la franquicia “Misión imposible”

Tom Morello: así fue como el guitarrista de Rage Against the Machine y Audioslave consiguió su sonido único

Muerte de una estrella pop: Diablo Cody producirá la película inspirada en el popular webtoon