Google tenta superar 'humanidade' de novo ChatGPT com assistentes de IA que erram menos

Empresa atualiza Gemini, aumenta capacidade de compreensão de chatbot, lança plataforma geradora de vídeo e novos produtos integrados a Android, Docs e Meets

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Pedro S. Teixeira Vitor Rosasco
São Paulo

O Google lançou ao público nesta terça-feira (14) o Gemini 1.5 Pro, um novo modelo de inteligência artificial capaz de entender até 14 livros ou duas horas de contexto.

Para superar os erros comumente cometidos por IA, como as alucinações, o presidente-executivo do Google, Sundar Pichai, diz que a empresa trabalhou para construir agentes de IA capazes de raciocinar e planejar para executar as tarefas especificadas.

O lançamento ocorre um dia após a OpenAI ter lançado uma nova versão do ChatGPT, que impressionou as pessoas nas redes sociais pela capacidade de conversar em tempo real. Na apresentação, feita totalmente ao vivo, o chatbot cometeu alguns deslizes, como confundir a foto de uma pessoa com um tronco de árvore.

As demonstrações do Google, no entanto, foram gravadas.

Um milhão de pessoas se inscreveram para testar o Gemini —a OpenAI diz que o ChatGPT tem mais de 100 milhões de usuários mensais.

Foto ilustrativa de smartphone com aplicativo do Gemini aberto na tela
Foto ilustrativa de smartphone com aplicativo do Gemini aberto na tela - Michael M. Santiago/Getty Images via AFP

Os agentes de IA do Google usam dados climáticos, informações de catálogos e mapas para adicionar contexto aos pedidos feitos pelo usuário, de acordo com a executiva da empresa para buscas, Liz Reid.

O Gemini, apresentado em fevereiro, foi a primeira IA treinada para compreender áudio, vídeo e texto ao mesmo tempo, como faz nova versão do ChatGPT. O Google, no entanto, foi criticado por editar vídeos para fazer as respostas do chatbot parecerem mais rápidas.

A empresa demonstrou como o Gemini pode identificar imagens pela câmera e conversar. O Gemini Pro, no entanto, não demonstrou as capacidades de variação de tom de voz nem de identificação de emoções, apresentadas pela OpenAI na segunda (13).

A versão do chatbot do Google capaz de entender imagens e conversar, chamadas de Projeto Astra, chegará ao público ainda neste ano. Participantes do programa de teste do Google já podem acessar a tecnologia. Já o aplicativo do ChatGPT com essas habilidades começa a estar disponível a partir da próxima segunda (20), para testadores selecionados.

Quando o Projeto Astra for lançado, será possível conversar com o assistente para smartphone em tempo real, com a possibilidade de interromper as respostas, de acordo com o Google.

Os assinantes do pacote Gemini Advanced, disponível por US$ 20 (R$ 104), terão acesso a uma quantidade predeterminada de interações com a versão mais avançada do modelo, o Gemini 1.5 Pro —serão 1,5 milhão de tokens, a unidade de conversão para geração de palavras correspondentes em média a uma sílaba. O Google não informou se usuários não pagantes terão acesso à tecnologia.

O Google diz que o modelo entende até 2 milhões de tokens de contexto —cerca de 14 livros de 400 páginas—, escala de entendimento sem par no mercado.

A empresa também anunciou um modelo de IA capaz de gerar vídeos a partir de comandos de texto, como faz o Sora, da OpenAI. Chamada de Veo, a ferramenta tem, de acordo com o gigante das buscas, "profunda capacidade de compreensão" e entende comandos como "câmera lenta" e "imagens aéreas".

A distribuição da ferramenta terá foco em produtores de vídeo e estará disponível para alguns criadores do Youtube. O Google planeja oferecê-la também para estúdios de cinema mundo afora.

O gigante das buscas continua a apostar na integração de inteligência artificial com suas soluções para computador e smartphone.

Em sua plataforma de trabalho, Workspace, o Gemini 1.5 poderá ajudar na redação de emails e de documentos no Google Docs. Também atuará como assistente na edição de planilhas. A ferramenta será lançada no "próximo mês".

A integração da IA terá um painel próprio nos aplicativos do Google, com sugestões de pedido para acelerar a interação com a inteligência artificial.

O Google mostrou relatos de programadores que usam também o Gemini para programar. A versão anterior da IA generativa da empresa, Bard, foi criticada por não se comparar ao ChatGPT no que tocava à geração de código de computação.

Após uma reunião no Google Meet, será possível pedir um resumo dos pontos mais importantes em debate no encontro ao Gemini.

No smartphones Android (sistema operacional do Google), será possível, por exemplo, procurar fotos com instruções em texto. Para permitir que celulares operem os modelos de inteligência artificial localmente, o Google lançou uma versão mais leve de sua tecnologia, o Gemini 1.5 Flash, já disponível no smartphone Google Pixel. A empresa também conversa sobre acordos para compartilhar tecnologia com a Apple.

O Google anunciou no último dia 30 o lançamento do aplicativo da inteligência artificial generativa Gemini em português. O app já está disponível na Play Store, em celulares Android, e deve chegar a aparelhos da Apple "nos próximos dias".

A proposta da solução é turbinar o Google Assistente, que recebe comandos por voz, com inteligência artificial generativa. "O novo serviço de IA pode ajudar as pessoas economizarem tempo recuperando informações relevantes de aplicativos e serviços do Google, como Gmail, Busca, Google Voos e YouTube", diz o anúncio do gigante das buscas.

O sistema de inteligência artificial generativa Gemini foi lançado em 8 de fevereiro e substituiu o Bard. O chatbot do Google, mesmo que aberto ao público e capaz de gerar imagens, não recebeu a mesma projeção do que o ChatGPT. Já no vídeo de anúncio, o Bard cometeu uma gafe e disse que o telescópio James Webb havia capturado as primeiras imagens de planetas fora do sistema solar.

Também é possível acessar o Gemini no navegador Google Chrome. Basta digitar @gemini seguido do comando na barra de endereço do Chrome e o gemini.google.com é iniciado com uma resposta pronta.

Printscreen da pergunta feita ao Bard sobre as descobertas do telescópio James Webb. O robô responde: as primeiras imagens capturadas de planetas fora do Sistema Solar.
Interface do Bard, chatbot anunciado pelo Google nesta segunda (6). Foto mostra pergunta feita ao Bard sobre feitos do telescópio James Webb - Reprodução/Google

LANÇAMENTOS DESTA TERÇA

Gemini 1.5 Pro

Modelo de inteligência artificial generativa mais avançado do Google, apresentado ao público nesta terça. Tecnologia tem capacidade de compreender até 14 livros de 400 páginas de contexto. Podem acessá-los, com limites, os assinantes do plano Gemini Advanced, vendido por US$ 20 (R$ 104) mensais.

Gemini 1.5 Flash

Modelo de IA generativa compacto, feito para rodar em smartphones. Estará disponível no app do Gemini para celular e no smartphone Google Pixel 9. Tem menor capacidade técnica, mas é útil em funções simples que não precisem de processamento em nuvem, por diminuir o intervalo entre o pedido e a resposta.

Projeto Astra

Trabalho do Google para garantir interpretação de imagem e áudio em plataformas de inteligência artificial da empresa, como o ChatGPT será capaz de fazer, de acordo com a apresentação da OpenAI de segunda (13). O Google disse que recursos passarão a funcionar "mais tarde neste ano" e estarão disponíveis na internet e no aplicativo para smartphone.

Google Veo

Modelo de IA capaz de gerar vídeos a partir de comandos de texto. A ferramenta tem, de acordo com o gigante das buscas, "profunda capacidade de compreensão" e entende comandos como "câmera lenta" e "imagens aéreas". A distribuição da ferramenta terá foco em produtores de vídeo e estará disponível para alguns criadores do Youtube.

Gemini no Workspace

A partir do mês que vem, o Google começará a disponibilizar ferramentas turbinadas com IA em sua plataforma de escritório Workspace, cujo preço de adesão é a partir de R$ 28 mensais.

  • No Gmail, será possível resumir emails e receber sugestões de respostas automáticas a emails com base no contexto. A solução funcionará a partir de botões.
  • O Google Meet ganhará a opção de tradução ao vivo com auxílio de inteligência artificial em 60 idiomas.
  • No Google Docs, a função de auxílio na escrita passará a funcionar em português e espanhol.
  • A plataforma ganha um painel lateral, que funcionará como um assistente de IA recebendo consultar do usuário.
  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.