NoticiasInteligência ArtificialTecnologia

ChatGPT terá voz bidirecional Bidi 1

PUBLICIDADE

A voz bidirecional do ChatGPT deve começar a chegar a usuários nesta semana com o modelo Bidi 1, segundo informações publicadas pelo TestingCatalog em 23 de junho de 2026. A novidade, ainda não anunciada oficialmente pela OpenAI, promete tornar as conversas por áudio mais naturais: o assistente poderá ouvir, falar e manter a escuta ao mesmo tempo, sem interromper o usuário de forma brusca. A atualização foi identificada na interface web do ChatGPT e também apareceu para uma parte limitada dos usuários no aplicativo.

O que é a voz bidirecional do ChatGPT

A voz bidirecional do ChatGPT é uma evolução do modo de voz avançado. Na prática, ela permite que o sistema continue ouvindo enquanto fala, reconheça pausas longas e faça pequenas confirmações, como “ok”, sem assumir que o usuário terminou a frase. Esse comportamento aproxima o chatbot de uma conversa humana, em que duas pessoas podem sinalizar atenção sem quebrar o raciocínio uma da outra.

O nome Bidi 1 aparece como abreviação de “bidirectional”, ou bidirecional. Segundo os testes iniciais, o recurso surge no seletor de modelos, ao lado das opções padrão e avançada. Quando ativado, o balão de voz fica amarelo, indicando que o novo modelo de áudio está em uso.

PUBLICIDADE

Como o Bidi 1 muda a conversa por áudio

O principal avanço está na escuta simultânea. Hoje, assistentes de voz costumam alternar entre “ouvir” e “responder”. Isso cria atrasos, cortes e interrupções. Com a voz bidirecional do ChatGPT, a OpenAI tenta resolver esse limite ao permitir que o assistente acompanhe a fala em tempo real e ajuste a resposta durante a própria interação.

  • Escuta contínua durante a fala do assistente.
  • Menos interrupções em pausas longas.
  • Retenção melhor do contexto da conversa.
  • Mudança rápida de tarefa por comando de voz.
  • Possível tradução em tempo real no futuro.

Nos exemplos relatados, o usuário poderia pedir ao ChatGPT para contar até dez e, no meio da contagem, interromper com uma nova instrução, como inverter a ordem. O Bidi 1 ajustaria a tarefa imediatamente, sem reiniciar toda a conversa. Esse tipo de resposta é relevante para aulas, reuniões, suporte técnico, acessibilidade e uso do ChatGPT como assistente pessoal.

Tradução em tempo real e uso em APIs

Outro ponto citado nos testes é a tradução em tempo real. Se confirmada, a voz bidirecional do ChatGPT poderá ouvir uma pessoa em um idioma e responder, quase instantaneamente, em outro. Isso ampliaria o uso em viagens, atendimento ao cliente, educação bilíngue e reuniões internacionais.

A publicação também aponta que o recurso pode chegar futuramente às APIs da OpenAI, embora não exista cronograma confirmado. Uma API com modelo de áudio bidirecional permitiria que empresas criassem centrais de atendimento, tutores por voz, copilotos corporativos e ferramentas de acessibilidade com menor latência.

Contexto, pausas e respostas mais naturais

Um dos problemas mais citados no modo de voz atual é a perda de contexto. Em conversas longas, o assistente pode esquecer partes importantes ou responder antes da conclusão do pensamento do usuário. O Bidi 1 busca corrigir isso ao manter o fio da conversa por mais tempo e ao interpretar pausas com mais cuidado.

Interface do ChatGPT durante testes do modo de voz Bidi 1

Também há continuidade de recursos criativos do modo de voz avançado, como cantar ou fazer beatbox. Porém, o controle de direitos autorais parece mais rígido: o sistema recusaria músicas populares protegidas, mas ainda poderia tentar uma composição original inspirada em determinado estilo artístico.

Lançamento ainda não foi confirmado pela OpenAI

Apesar dos indícios, é importante tratar a informação como uma atualização em preparação. A OpenAI não publicou, até o momento, um anúncio formal sobre a voz bidirecional do ChatGPT. O TestingCatalog afirma que a liberação deve ocorrer de forma gradual e opcional, em web e mobile.

Referências ao Bidi 1 começaram a aparecer na interface web do ChatGPT antes de um possível lançamento nesta semana.

TestingCatalog, publicação de Alexey Shabanov

A região do Espaço Econômico Europeu pode receber o recurso mais tarde, mas esse ponto também não foi confirmado. O Codex, ferramenta ligada a programação e agentes de desenvolvimento, aparece como possível candidato a uma atualização de voz em semanas posteriores. Nesse caso, seria um lançamento separado.

Por que isso importa para o futuro do ChatGPT

A aposta em áudio mostra que a OpenAI quer aproximar seus modelos de texto de uma experiência conversacional contínua. Se a voz bidirecional do ChatGPT funcionar como descrita, o aplicativo deixa de ser apenas uma caixa de texto inteligente e passa a competir mais diretamente com assistentes pessoais, tradutores simultâneos e ferramentas de produtividade por voz.

Para o usuário comum, a mudança pode parecer simples: menos cortes, respostas mais rápidas e conversas menos robóticas. Para empresas e desenvolvedores, porém, o Bidi 1 pode abrir uma nova camada de produtos baseados em IA conversacional, especialmente se chegar às APIs com estabilidade e baixo atraso.

Perguntas Frequentes sobre a voz bidirecional do ChatGPT

  1. O que é o Bidi 1 no ChatGPT?

    É um modelo de voz bidirecional da OpenAI. Ele permite ouvir e responder com mais naturalidade, mantendo melhor o contexto da conversa.

  2. A voz bidirecional do ChatGPT já foi lançada?

    Ainda não houve anúncio oficial da OpenAI. Segundo o TestingCatalog, o recurso começou a aparecer para alguns usuários em testes graduais.

  3. O Bidi 1 fará tradução em tempo real?

    Os testes indicam essa possibilidade. A função pode permitir conversas multilíngues ao vivo, mas o cronograma público ainda não foi confirmado.

  4. O novo modo de voz chegará às APIs da OpenAI?

    A chegada às APIs é considerada possível, mas sem data definida. Se ocorrer, deve beneficiar apps de atendimento, educação e acessibilidade.

Considerações finais

A voz bidirecional do ChatGPT pode ser uma das maiores atualizações de áudio do serviço em meses. O Bidi 1 promete escuta simultânea, melhor memória de contexto, respostas menos invasivas e tradução em tempo real. Ainda assim, como a OpenAI não confirmou oficialmente o lançamento, os detalhes devem ser acompanhados com cautela até a liberação pública.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.