Duelo de inteligencia artificial: las novedades del Chat GPT -de Microsoft- y de Gemini -de Google- Teledoce.com

Duelo de inteligencia artificial: las novedades del Chat GPT -de Microsoft- y de Gemini -de Google-

Las nuevas funcionalidades de estos gigantes tecnológicos estarán disponibles sin la necesidad de pagar una suscripción.

La empresa Open AI -de Microsoft- lanzó una nueva versión del Chat GPT. Se trata de GPT-4o. Pero su competidor, Google, también lanzó una nueva versión de Gemini conocida como, 1.5 Pro. En ambos casos se trata de nuevas herramientas de inteligencia artificial, cada vez más potentes y personalizadas. 

La inteligencia artificial generativa basada en aprendizaje automático se ha convertido en un caballito de batalla para varias empresas que luchan por hacerse pioneros de alguna innovación: Microsoft con Copilot y Chat GPT, Google con Gemini y otro tanto menos renombrados, pero que van ganando terreno. 

De hecho, en estas últimas 24 horas ambos competidores lanzaron nuevas versiones de sus estrellas. 

Google presentó Gemini 1.5 Pro, que se destaca especialmente en aplicaciones que requieren de la generación de resúmenes, chat, subtitulación de imágenes y videos, y extracción de datos de documentos extensos y tablas.

Está disponible en más de 35 idiomas, lo que abre la puerta a una experiencia más inclusiva y accesible a nivel mundial. Además se agregó la optimización en la generación de código, el razonamiento lógico, la planificación, las conversaciones de múltiples turnos, y la comprensión de audio e imágenes.

Pero Open IA también hizo un anuncio: la llegada del Ghat GPT-4o da un paso más hacia una interacción persona-computadora mucho más fluida y natural. El nuevo modelo aceptará como entrada cualquier combinación de texto, audio e imagen, y es capaz de generar cualquier combinación de salidas de texto, audio e imagen.

Su velocidad de respuesta puede llegar a ser de tan solo 232 milisegundos, alcanzando un promedio de 320 milisegundos, tiempo similar al que se toma un humano para responder en una conversación normal.

Se puede elegir entre una lectura o conversación más robótica o dramatizada. Los usuarios pueden interrumpirlo como si estuvieran en una charla coloquial y si se activa la cámara, es capaz de leer las emociones en los rostros guiarlos para que hagan ejercicios de respiración, contarles una historia o ayudarlos a resolver un problema matemático, hacer de juez en una batalla de piedra, papel o tijera, entre otras cosas.

Sin embargo, aún restan resolver algunos detalles no menores como son los derechos de autor y creación, que exigen recibir pagos por usar sus contenidos para entrenar a sus modelos informáticos.

Las nuevas funcionalidades de estos gigantes tecnológicos estarán disponibles sin la necesidad de pagar una suscripción.


Las Más Vistas