O que é o GPT-5.3-Codex-Spark?

O GPT-5.3-Codex-Spark é um modelo de codificação em tempo real desenvolvido pela OpenAI, otimizado para gerar e editar código instantaneamente. É baseado na arquitetura Cerebras Wafer-Scale Engine 3 e visa acelerar fluxos de desenvolvimento dentro do ChatGPT Pro.

Como acessar o Codex-Spark?

Atualmente, o Codex-Spark está disponível para assinantes do ChatGPT Pro e para parceiros de design com acesso antecipado via API. O modelo também pode ser usado através da extensão do VS Code e do aplicativo Codex CLI.

Qual a principal vantagem do Codex-Spark?

O modelo oferece desempenho de latência ultrabaixa, capaz de gerar mais de 1.000 tokens por segundo, ideal para iterações rápidas em projetos de software. Além disso, opera com um pipeline otimizado que reduz o tempo de resposta pela metade.

O Codex-Spark é seguro para uso corporativo?

Sim. A OpenAI aplicou os mesmos padrões de segurança dos modelos GPT principais, incluindo filtragem de conteúdo sensível e treinamento específico em cibersegurança. O modelo foi validado pelo processo interno de segurança e conformidade.

Ilustração do GPT-5.3-Codex-Spark desenvolvido pela OpenAI com infraestrutura Cerebras.

OpenAI lança GPT-5.3-Codex-Spark com infraestrutura Cerebras

14 de fevereiro de 2026 Diogo Fernando chatgpt, openai 6 min Leitura

A OpenAI apresentou oficialmente o GPT-5.3-Codex-Spark em 12 de fevereiro de 2026, um novo modelo voltado à codificação em tempo real que promete revolucionar o fluxo de trabalho de desenvolvedores. Alimentado pela infraestrutura Cerebras Wafer-Scale Engine 3, o novo Codex oferece respostas instantâneas e capacidade de geração acima de 1.000 tokens por segundo, tornando-se o primeiro modelo da OpenAI totalmente otimizado para iterações rápidas de código.

Tabela de conteúdos

Uma revolução para desenvolvedores do ChatGPT Pro

O novo modelo Codex-Spark foi lançado inicialmente para usuários do ChatGPT Pro por meio do aplicativo Codex, da CLI integrada e da extensão Visual Studio Code. O objetivo é oferecer um ambiente de codificação que permita ajustes imediatos de lógica, refinamento de interface e pequenas modificações de estrutura com retorno instantâneo — sem longos períodos de espera para execução ou testes.

Segundo a OpenAI, o Spark adota um modo de trabalho leve, voltado a edições minimalistas. Os testes automáticos só são executados quando solicitados, o que ajuda a manter o foco no fluxo de edição. O modelo é totalmente textual, com janela de contexto de 128k, e opera com limites de uso separados, não interferindo nos limites padrão do ChatGPT.

Alguns usuários podem enfrentar filas momentâneas durante períodos de alta demanda, já que a capacidade global ainda está em expansão. A OpenAI prometeu ampliar o acesso gradualmente nas próximas semanas, à medida que consolida a infraestrutura e a experiência ponta a ponta da plataforma.

Velocidade e arquitetura: o diferencial Cerebras

O principal destaque do GPT-5.3-Codex-Spark está na combinação entre IA e hardware dedicado. O modelo é hospedado em servidores equipados com o Cerebras Wafer-Scale Engine 3, conhecido por sua arquitetura de baixa latência e desempenho incomparável em cargas de inferência. Essa parceria marca o primeiro grande resultado do acordo OpenAI–Cerebras anunciado em janeiro.

Segundo líderes da Cerebras, esta fase de testes permite explorar novos padrões de uso habilitados pela inferência ultrarrápida. Já a equipe de computação da OpenAI reforça que essa tecnologia não substitui os GPUs tradicionais, mas os complementa em fluxos de trabalho que exigem respostas instantâneas. Para modelos sensíveis à latência, essa sinergia promete ganhos expressivos de desempenho.

GPT-5.3-Codex-Spark is now in research preview.

You can just build things—faster. pic.twitter.com/85LzDOgcQj
— OpenAI (@OpenAI) February 12, 2026

Pipeline reformulado e latência reduzida

A OpenAI afirma que a velocidade do modelo foi apenas parte da equação. A companhia reescreveu o pipeline completo de requisições e respostas, incorporando persistência via WebSocket e reduzindo sobrecargas de comunicação. Os ganhos incluem uma redução de 80% na latência por ciclo, 30% na sobrecarga por token e 50% no tempo até a primeira resposta, uma melhoria significativa em tarefas iterativas.

Essa arquitetura aprimorada será gradualmente implementada em outras linhas de modelos, consolidando uma infraestrutura de baixa latência como padrão para interações futuras do ecossistema OpenAI. Além disso, o recurso de comunicação persistente cria um fluxo contínuo entre usuário e servidor, essencial para manutenção de estados durante sessões prolongadas de codificação colaborativa.

Foco em segurança e responsabilidade

A OpenAI assegurou que o Codex-Spark herda o mesmo protocolo de segurança e treinamento de mitigação de riscos das linhas principais do GPT-5. Isso inclui treinamentos voltados a cibersegurança e validação ética antes da implantação. Durante a avaliação interna, o modelo não atingiu o limiar de capacidade que exigiria avaliação adicional no Preparedness Framework, especialmente em áreas sensíveis como biotecnologia e defesa cibernética.

Complemento ao GPT-5.3-Codex

O GPT-5.3-Codex-Spark funciona como uma versão complementar ao modelo GPT-5.3-Codex tradicional. Enquanto o modelo completo é voltado a tarefas de longa duração — capazes de processar horas de contexto e raciocínio — o Spark foi desenhado para iterações rápidas e construção incremental. A OpenAI pretende, no futuro, fundir as duas abordagens em um fluxo de trabalho unificado, reunindo velocidade e profundidade cognitiva.

“Nosso objetivo é oferecer o melhor dos dois mundos: colaboração em tempo real e execução de longo prazo no mesmo ambiente de codificação.”
Equipe de Engenharia da OpenAI

Disponibilidade e acesso expandido

Durante a fase inicial, o acesso ao GPT-5.3-Codex-Spark está disponível apenas para usuários do ChatGPT Pro e para um grupo restrito de parceiros de design experimentando integrações via API. A empresa confirmou que planeja expandir o acesso ao longo das próximas semanas, conforme a capacidade de datacenters for ampliada.

Essa estratégia de liberação progressiva reflete a postura cautelosa da OpenAI com novos lançamentos de inteligência artificial generativa, priorizando estabilidade, segurança e confiabilidade. Desenvolvedores que buscam ciclos curtos de feedback já podem experimentar o Spark diretamente pelo aplicativo Codex atualizado.

Perguntas frequentes sobre GPT-5.3-Codex-Spark

O que é o GPT-5.3-Codex-Spark?
O GPT-5.3-Codex-Spark é um modelo de codificação em tempo real desenvolvido pela OpenAI, otimizado para gerar e editar código instantaneamente. É baseado na arquitetura Cerebras Wafer-Scale Engine 3 e visa acelerar fluxos de desenvolvimento dentro do ChatGPT Pro.
Como acessar o Codex-Spark?
Atualmente, o Codex-Spark está disponível para assinantes do ChatGPT Pro e para parceiros de design com acesso antecipado via API. O modelo também pode ser usado através da extensão do VS Code e do aplicativo Codex CLI.
Qual a principal vantagem do Codex-Spark?
O modelo oferece desempenho de latência ultrabaixa, capaz de gerar mais de 1.000 tokens por segundo, ideal para iterações rápidas em projetos de software. Além disso, opera com um pipeline otimizado que reduz o tempo de resposta pela metade.
O Codex-Spark é seguro para uso corporativo?
Sim. A OpenAI aplicou os mesmos padrões de segurança dos modelos GPT principais, incluindo filtragem de conteúdo sensível e treinamento específico em cibersegurança. O modelo foi validado pelo processo interno de segurança e conformidade.

Considerações finais

O lançamento do GPT-5.3-Codex-Spark inaugura uma nova era de produtividade para desenvolvedores e integra-se à estratégia da OpenAI de oferecer ferramentas adaptadas a múltiplos cenários. Ao unir infraestrutura de alta velocidade da Cerebras com os avanços do GPT-5.3, a empresa redefine o conceito de codificação assistida por IA, aproximando o fluxo humano e automação com fluidez sem precedentes.