
Gemini 3.5 Flash ganha Computer Use
O Gemini 3.5 Flash agora integra o recurso Computer Use, permitindo que agentes de IA observem, raciocinem e executem ações em navegadores, dispositivos móveis e ambientes desktop. A novidade, anunciada pelo Google e repercutida pelo TestingCatalog em 27 de junho de 2026, mira desenvolvedores e empresas que buscam automação avançada com mais desempenho, controle e salvaguardas contra tarefas sensíveis ou ataques de prompt injection.
O que muda no Gemini 3.5 Flash com Computer Use
A principal mudança é que o Computer Use deixa de depender apenas de um modelo separado e passa a funcionar de forma nativa no Gemini 3.5 Flash. Antes, essa capacidade estava associada ao modelo Gemini 2.5 Computer Use. Com a integração, o Google tenta reduzir fricção para equipes que constroem agentes personalizados, pois o mesmo modelo pode interpretar uma tarefa, navegar por interfaces e executar etapas em diferentes plataformas.
Na prática, isso significa que um agente pode acompanhar fluxos de trabalho em um navegador, interagir com sistemas corporativos, preencher formulários, abrir ferramentas internas, organizar informações e apoiar processos repetitivos. O foco inicial está em desenvolvedores e clientes corporativos com acesso pela Gemini API e pela Gemini Enterprise Agent Platform.
Como os agentes passam a agir em navegador, mobile e desktop
O recurso de uso do computador foi desenhado para permitir que agentes de IA “vejam” o contexto de uma interface, raciocinem sobre o próximo passo e executem ações. Essa abordagem é importante porque muitos processos empresariais ainda dependem de telas, menus, caixas de texto, dashboards e sistemas legados que não têm APIs simples ou padronizadas.
Com o Gemini 3.5 Flash, o Google afirma haver melhorias em tarefas de automação relacionadas ao trabalho, como abertura e preenchimento de tickets, testes contínuos de software e atividades de conhecimento empresarial. A promessa é combinar velocidade do modelo Flash com capacidade agentiva, mantendo suporte a múltiplos ambientes.
- Automação em navegadores web e ferramentas internas.
- Execução de tarefas em ambientes desktop corporativos.
- Suporte a fluxos mobile em aplicativos e interfaces adaptadas.
- Uso em testes de software, triagem e operações repetitivas.
- Integração com agentes personalizados via Gemini API.
Segurança: confirmação humana e bloqueio de prompt injection
O ponto mais sensível da novidade é a segurança. Agentes que podem clicar, digitar e executar comandos aumentam a produtividade, mas também elevam o risco de ações indevidas. Por isso, o Google destaca salvaguardas voltadas ao uso empresarial. A primeira exige confirmação explícita do usuário antes de ações consideradas sensíveis. A segunda pode interromper uma tarefa quando sinais de prompt injection indireto forem detectados.
Prompt injection indireto ocorre quando uma instrução maliciosa aparece em uma página, documento, e-mail ou outro conteúdo lido pelo agente, tentando desviá-lo de sua tarefa original. Em ambientes corporativos, esse tipo de ataque pode induzir um sistema de IA a divulgar dados, alterar registros ou tomar decisões sem autorização adequada.
O Google recomenda combinar as salvaguardas do Gemini 3.5 Flash com sandboxing, verificação humana no fluxo e controles rígidos de acesso.
Publicação de Omar Sanseviero no X
A atualização também foi destacada por Omar Sanseviero, do Google, em uma publicação no X. Como há uma incorporação pública disponível, o post pode ser incluído no artigo. Não foram identificados vídeos do YouTube nem publicações do Instagram associados ao material fornecido.
Por que isso importa para empresas e desenvolvedores
A integração do Computer Use ao Gemini 3.5 Flash reforça uma tendência clara no mercado de IA: a passagem de chatbots que apenas respondem perguntas para agentes capazes de executar tarefas completas. Para empresas, isso pode significar redução de trabalho manual em áreas como suporte, engenharia, qualidade, backoffice, análise de dados e gestão operacional.
Desenvolvedores também ganham um caminho mais direto para construir agentes customizados. Em vez de depender de scripts frágeis ou integrações específicas para cada sistema, o modelo pode operar sobre interfaces existentes. Ainda assim, a adoção exige governança. Empresas precisam definir permissões, registrar logs, limitar escopos de ação e revisar decisões críticas antes de liberar automações em produção.

Limites, riscos e próximos passos
Apesar do avanço, agentes de IA com acesso a interfaces não devem ser tratados como sistemas infalíveis. Eles podem interpretar instruções de forma ambígua, encontrar páginas inesperadas, lidar mal com permissões ou falhar diante de mudanças visuais em um aplicativo. Por isso, fluxos com dados financeiros, informações pessoais, credenciais, exclusões de arquivos ou alterações administrativas devem continuar exigindo validação humana.
O movimento do Google também intensifica a disputa com outras plataformas de IA que investem em agentes, automação e ferramentas corporativas. A diferença competitiva tende a depender de três fatores: desempenho do modelo, confiabilidade na execução e qualidade das camadas de segurança. Se o Gemini Enterprise Agent Platform conseguir entregar esses pontos com consistência, o Gemini 3.5 Flash poderá ganhar espaço em projetos reais de automação empresarial.
Segundo o Google, o Computer Use no Gemini 3.5 Flash permite que o modelo raciocine e aja em plataformas de navegador, mobile e desktop, com proteções adicionais para ambientes empresariais.
Fonte: Google Blog e TestingCatalog
Perguntas Frequentes sobre Gemini 3.5 Flash e Computer Use
O que é Computer Use no Gemini 3.5 Flash?
É a capacidade de agentes de IA observarem interfaces, raciocinarem sobre etapas e executarem ações em navegador, mobile e desktop com controles de segurança.
Quem pode usar o novo recurso do Gemini?
A disponibilidade inicial é voltada a desenvolvedores e empresas por meio da Gemini API e da Gemini Enterprise Agent Platform, segundo a cobertura original.
O Gemini 3.5 Flash pode executar ações sensíveis sozinho?
O Google prevê confirmação explícita do usuário para ações sensíveis, além de mecanismos que interrompem tarefas quando há suspeita de prompt injection indireto.
Há vídeo do YouTube ou post do Instagram para incorporar?
No material analisado, não há vídeo do YouTube nem publicação do Instagram. A incorporação identificada é um post público no X de Omar Sanseviero.
Considerações finais
A chegada do Computer Use ao Gemini 3.5 Flash é um passo relevante para agentes de IA mais úteis no ambiente corporativo. A integração nativa promete automação mais ampla em navegador, mobile e desktop, mas seu sucesso dependerá de segurança, governança e supervisão humana. Para desenvolvedores e empresas, a novidade abre espaço para fluxos mais inteligentes, desde testes de software até operações internas complexas, sem dispensar controles rigorosos contra erros e abusos.
