
OpenAI testa voz em tempo real no Codex
A OpenAI está testando voz em tempo real no Codex, segundo achados publicados pelo TestingCatalog em 19 de junho de 2026. A novidade aparece em controles internos do aplicativo de codificação, com wake word, atalho de teclado, avatar animado e sinais de integração mais profunda com o modo de voz do ChatGPT. Por enquanto, trata-se de um recurso em preparação, sem anúncio público formal da OpenAI.
Em resumo: a OpenAI parece aproximar Codex e ChatGPT em uma experiência única de voz, com comandos contínuos para programação assistida por IA.
Tabela de conteúdos
O que é a voz em tempo real no Codex
A voz em tempo real no Codex é um conjunto de controles que permitiria ao desenvolvedor manter um canal falado ativo enquanto trabalha com código. Em vez de depender apenas de texto, o usuário poderia acionar o agente de codificação por voz, iniciar uma sessão, pedir alterações, acompanhar execuções e continuar a conversa com contexto preservado.
O ponto mais relevante é que o recurso não parece isolado. A interface cita a expressão “Hey Chat” como frase de ativação, e não “Hey Codex”. Isso sugere que a OpenAI pode estar tratando o Codex, seu assistente voltado a programação, como parte de uma superfície mais ampla ligada ao ChatGPT.
Pets no Codex, Orb e sessão contínua
De acordo com o TestingCatalog, um botão de voz que antes não executava ações agora aciona o Pet animado do Codex. Esse detalhe indica que a manipulação de sessões já estaria funcional em algum nível, mesmo antes de uma liberação pública. A OpenAI adicionou esses Pets ao Codex anteriormente como avatares animados para tornar a experiência mais visual e interativa.

Entre as opções encontradas, há um atalho de teclado, uma palavra de ativação e um modo chamado “single-tone”. Esse modo manteria novas interações presas a um mesmo encadeamento orquestrador, em vez de abrir sessões novas a cada comando. Na prática, isso ajudaria o desenvolvedor a retomar o mesmo contexto contínuo durante uma tarefa de programação.
- Wake word configurada com a frase “Hey Chat”.
- Atalho de teclado para iniciar comandos de voz.
- Modo de sessão contínua para preservar contexto.
- Avatar em overlay, com Pet ou possível Orb.
- Indícios de aproximação entre Codex e ChatGPT.
Integração com ChatGPT pode ser o ponto central
A presença de elementos já associados ao ChatGPT é o aspecto mais estratégico da notícia. O artigo original cita um Orb, uma Library semelhante à do ChatGPT e a própria frase “Hey Chat”. Juntos, esses sinais apontam para uma possível convergência entre o agente de codificação e o assistente de uso geral da OpenAI.

A Library no Codex, segundo a apuração, já aparece na barra lateral, mas ainda não pode ser aberta. Mesmo assim, o formato se aproxima do sistema usado no ChatGPT. Caso esse caminho se confirme, a voz em tempo real no Codex poderia funcionar como uma extensão natural do modo de voz do ChatGPT, adaptada para fluxos de desenvolvimento.
Por que isso importa para desenvolvedores
Um canal falado e contínuo pode reduzir interrupções no fluxo de trabalho. O programador poderia pedir refatorações, explicar bugs, solicitar testes e acompanhar resultados sem alternar constantemente entre teclado, terminal e chat.
GPT-Bidi-1 e a próxima geração de voz
A janela de testes coincide com sinais de que a OpenAI prepara uma atualização maior para o modo de voz do ChatGPT. O TestingCatalog menciona um possível modelo de próxima geração identificado como GPT-Bidi-1, com arquitetura bidirecional. A ideia seria permitir que o sistema ouça e fale ao mesmo tempo, em vez de operar em turnos rígidos.
Se esse modelo chegar ao ChatGPT e depois ao Codex, a interação por voz poderia ficar mais natural. Em programação, isso é especialmente útil porque o usuário costuma interromper, corrigir instruções, reagir a erros e mudar prioridades enquanto o agente executa tarefas.
O TestingCatalog afirma que a chegada de controles de voz ao Codex “diz tanto sobre marca quanto sobre capacidade”, já que vários elementos remetem diretamente ao ChatGPT.
TestingCatalog, reportagem de Alexey Shabanov
Claude também avança no modo de voz
A movimentação da OpenAI ocorre em meio à disputa por interfaces de voz em IA. A Anthropic também estaria expandindo o Claude voice mode, com suporte multilíngue aparecendo antes de um anúncio formal e opção de push-to-talk. Isso sugere que as principais empresas de IA veem a voz como uma camada essencial para agentes digitais.
No caso do Codex, a diferença está no foco técnico. Um modo de voz integrado a um agente de codificação pode transformar a maneira como desenvolvedores interagem com modelos de linguagem. Em vez de apenas gerar trechos de código, o sistema poderia participar de uma sessão operacional, acompanhando contexto, comandos, resultados e preferências do projeto.
O que ainda não foi confirmado
Apesar dos indícios, ainda não há confirmação oficial de data, disponibilidade, países, idiomas ou planos de assinatura. Também não está claro se a voz em tempo real no Codex será lançada junto com uma atualização do ChatGPT ou se chegará depois. O próprio comportamento do Orb parece incompleto, já que o Pet continua sendo exibido no lugar dele.
| Elemento | Status relatado | Impacto provável |
| Wake word “Hey Chat” | Aparece nas configurações | Integração com ChatGPT |
| Pet animado | Já é acionado pelo botão | Interface visual de voz |
| Library no Codex | Visível, mas não aberta | Unificação de recursos |
| GPT-Bidi-1 | Indício não oficial | Conversas mais naturais |
Também não foram fornecidos links diretos para vídeos incorporáveis, YouTube, Twitter/X ou Instagram na pauta enviada. Por isso, este artigo não inclui embeds sociais ou de vídeo, preservando apenas as imagens disponíveis na fonte original.
Perguntas Frequentes sobre voz em tempo real no Codex
O que é voz em tempo real no Codex?
É um modo em testes para controlar o Codex por fala. Ele pode manter contexto contínuo, usar wake word e aproximar o agente de codificação do ChatGPT.
A OpenAI já lançou o recurso para todos?
Não. A novidade ainda não foi anunciada oficialmente. Os sinais vêm de telas internas e achados relatados pelo TestingCatalog em junho de 2026.
O que significa a wake word Hey Chat?
A frase sugere integração com ChatGPT. Ela indica que a OpenAI pode unificar Codex e assistente conversacional em uma mesma experiência de voz.
GPT-Bidi-1 será usado no Codex?
Ainda não há confirmação. O modelo é citado como possível base para voz bidirecional no ChatGPT, mas pode influenciar o Codex futuramente.
Considerações finais
A voz em tempo real no Codex ainda deve ser tratada como um recurso em teste, mas os sinais são consistentes: wake word, Pets, Orb, Library e contexto contínuo apontam para uma experiência mais integrada entre Codex e ChatGPT. Se a OpenAI confirmar essa direção, programar com agentes de IA poderá ficar menos dependente de comandos digitados e mais próximo de uma conversa contínua, multimodal e operacional.
