Descrição de chapéu internet tecnologia

ChatGPT torna gratuitas ferramentas da versão paga e divulga melhorias; veja IA cantando

OpenAI anuncia GPT-4o, IA que interage ao vivo por voz e vídeo; empresa reconhece que mensagens em áudio são risco em ano eleitoral

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

São Paulo

A OpenAI anunciou nesta segunda-feira (13) a primeira melhoria no ChatGPT gratuito desde o lançamento do chatbot, em novembro de 2022.

A plataforma aberta ao público em geral agora recebe instruções em áudio, faz análises de dados e cria gráficos, se lembra de conversas com o usuário, faz pesquisas na internet e tem a capacidade de raciocínio do modelo mais avançado da OpenAI, o GPT-4. Antes, o ChatGPT gratuito estava limitado ao GPT-3.5, do início 2022.

As mudanças estão previstas para as próximas semanas, sem data especificada. Os assinantes da versão do plano pago ChatGPT Plus, vendido por US$ 20 (R$ 102,81) mensais, poderão interagir cinco vezes mais com o GPT-4 do que as demais pessoas.

Smartphone mostra longo da OpenAI, e tela de notebook, à direita, mostra logo do ChatGPT, em foto ilustrativa
À esquerda, smartphone mostra longo da OpenAI, e tela de notebook, à direita, mostra logo do ChatGPT, em foto ilustrativa - Marco BertorelloAFP

Segundo a diretora de tecnologia da empresa, Mira Murati, a OpenAI pôde aumentar o público com acesso ao seu modelo mais potente por um avanço técnico: a criação do GPT-4o, uma rede neural cinco vezes mais veloz do que o GPT-4 original, com as mesmas capacidades de resposta, que requer menos processamento de dados. O custo para rodar o novo modelo caiu em 50%, segundo artigo publicado nesta segunda.

Quanto maior a demanda por processamento de dados, maior o custo da OpenAI com provedores de nuvem, como a Microsoft, que hospeda o ChatGPT. A OpenAI não tem infraestrutura própria, como o concorrente Google, e a alta demanda por peças da Nvidia dificulta os planos para construir data centers próprios.

"Um dos nossos objetivos é levar a tecnologia ao maior público possível de graça", afirmou Murati em transmissão ao vivo.

Em entrevista à Folha em novembro, quando o ChatGPT completou um ano, o vice-presidente da OpenAI responsável pelo ChatGPT, Srinivas Narayanan, havia afirmado que a empresa não tinha capacidade de levar o melhor de sua tecnologia a todo o público.

O usuário não assinante contribui com a empresa com dados sobre sua interação com o bot, que podem ser usados para melhorar o serviço.

Além de expandir o acesso ao GPT-4 para as pessoas que não pagam, a OpenAI afirma que seu novo modelo também permite diálogos por voz em tempo real, uma vez que o GPT-4o tem um atraso menor entre o pedido e a resposta —a chamada latência.

A empresa reconhece, entretanto, a função de conversa em áudio da nova tecnologia representa um risco de desinformação, especialmente em ano eleitoral. A OpenAI afirma que a plataforma está restrita a vozes preconfiguradas, para impedir a criação de deepfakes (vídeos e áudios feitos para copiar a identidade de uma pessoa). Além disso, a empresa diz que irá lançar uma plataforma para identificar áudios sintéticos gerados pelo GPT-4o.

A empresa havia informado à Folha que não tinha planos específicos para conter desinformação feita por inteligência artificial no contexto eleitoral brasileiro.

O "o" no nome da nova tecnologia vem de "omni", prefixo de origem latina que significa tudo ou todos. "É um passo em direção a uma interação mais natural entre pessoas e computadores. O modelo responde a uma pergunta de áudio com uma latência de 0,32 segundo, tempo de atraso similar a um humano, de acordo com a OpenAI. O modo de voz tinha latência entre 2,8 e 5,4 segundos antes do lançamento do GPT-4o.

O GPT-4o também melhorou sua performance em 50 idiomas, incluindo o português. Programadores podem acessar o novo modelo de linguagem a partir desta segunda (13).

O chefe de pesquisas de ponta da OpenAI, Mark Chen, apresentou um diálogo ao vivo com a nova versão do ChatGPT. O robô foi capaz de identificar que o pesquisador hiperventilava e o instruiu a fazer técnicas de respiração para se acalmar.

A OpenAI fez a apresentação ao vivo, após o Google receber críticas por editar vídeo de demonstração de seu modelo de inteligência artificial Gemini, para fazê-lo parecer mais impressionante.

O presidente do braço de pesquisas da OpenAI, Greg Brockman, depois publicou um vídeo em que dois celulares com aplicativo do ChatGPT interagem entre si. Depois, uma das IAs mostra também que é capaz de cantar.

Na demonstração das novas capacidades do ChatGPT, a plataforma foi capaz de resolver uma equação manuscrita em uma folha de papel sulfite e de contar histórias com variação no tom de voz.

"Nosso modelo foi preparado para captar nuances na voz do usuário e reproduzir os sentimentos mais adequados à situação", disse Chen.

O sucesso do novo modelo, conforme artigo da OpenAI, se deve ao treinamento de uma única rede neural para entender áudio, vídeo e texto. A estratégia já havia sido adotada pelo Google no treinamento do Gemini.

O anúncio do novo modelo foi feito um dia antes do principal evento do gigante das buscas, o Google IO, marcado para esta terça-feira (14). A expectativa é de mais anúncios de inteligênica artificial.

Na rede social X, usuários comentaram que a humanidade está cada vez mais próxima de uma realidade em que humanos mantenham relações com robôs, como no filme "Ela", estrelado por Joaquim Phoenix.

Em artigo publicado no sábado (11), o colunista do New York Times Kevin Roose relatou a experiência de manter diálogos por meses com 15 "amigos" criados por inteligência artificial. Os companheiros robóticos criticaram suas escolhas de roupa, lhe deram conselhos existenciais e interagiram entre si.

A OpenAI, contudo, parece continuar focada na criação de uma inteligência artificial voltada para auxiliar às pessoas em tarefas rotineiras. Na apresentação, Murati fez questão de mencionar palavras como "produtividade" e "transformação a partir da tecnologia".

O chefe-executivo da OpenAI, Sam Altman, já criticou mais de uma vez plataformas de inteligência artificial feitas para emular comportamentos humanos.

A empresa ainda abriu acesso para o público em geral aos GPTs —versões especializadas do ChatGPT, que podem ser criadas pelo usuário a partir de instruções em linguagem simples ou comprados prontos na GPT Store, como um aplicativo de smartphone. "Nossos desenvolvedores poderão vender suas criações para um público muito maior", disse Murati.

Donos de computadores da Apple também poderão baixar uma versão do ChatGPT para desktop, que vai funcionar como um assistente, a exemplo do copilot do Windows. Com a aplicação, é possível, por exemplo, acionar o ChatPGT ao pressionar "option + espaço".

A empresa não divulgou prazo para levar o programa ao Windows.

  • Salvar artigos

    Recurso exclusivo para assinantes

    assine ou faça login

Tópicos relacionados

Leia tudo sobre o tema e siga:

Comentários

Os comentários não representam a opinião do jornal; a responsabilidade é do autor da mensagem.