Google Gemini ganha marcação de imagem tipo Circle to Search
O Google Gemini está prestes a receber uma ferramenta de marcação de imagem (image markup) que permite destacar regiões específicas de uma foto para orientar a análise da IA — uma abordagem semelhante ao que o Circle to Search popularizou ao deixar o usuário “cercar” o que quer pesquisar na tela.
A novidade foi identificada em um APK teardown da versão 16.42.61.sa.arm64 do app Google e indica controles para desenhar sobre a imagem, escolher cores e focar a atenção do Gemini em um ponto de interesse. Além disso, o fluxo também conversa com o Nano Banana, recurso de edição que consegue remover elementos indesejados em capturas de tela. Embora promissor, vale lembrar: recursos flagrados em código em desenvolvimento podem não chegar ao público.
Tabela de conteúdos
O que muda: desenhe e aponte o que o Gemini deve analisar
Hoje, já é possível enviar uma foto ao Gemini e fazer perguntas sobre o conteúdo. Com a nova camada de marcação, o fluxo fica mais granular: após escolher uma imagem da galeria ou tirar uma foto, o usuário poderá desenhar círculos, setas ou traços diretamente sobre a área de interesse. Na prática, isso cria uma região de interesse (ROI) que sinaliza à IA onde concentrar a compreensão e as respostas. Mesmo sem instruções textuais explícitas, o modelo entende que a área circundada é o foco da solicitação — e ainda permite comandos diretos, como “explique apenas o que está dentro do círculo” ou “compare o objeto destacado com X”.



Semelhante ao Circle to Search, mas dentro do Gemini
O paralelo com o Circle to Search é natural: ali, o usuário circula qualquer parte da tela para iniciar uma busca contextual. Já no Gemini, o destaque é aplicado dentro do fluxo de prompt com imagem — o que facilita orientar tarefas multimodais, como resumir um gráfico, identificar um componente eletrônico, traduzir apenas um rótulo ou comparar duas peças de um catálogo. A expectativa é que o recurso melhore a precisão ao filtrar ruído visual, além de reduzir a necessidade de prompts longos para dizer ao modelo “onde olhar”.
- Foco de análise em uma área específica (ROI).
- Interações multimodais mais rápidas e objetivas.
- Menos ambiguidade em cenas complexas ou cheias de objetos.
- Possibilidade de combinar texto + região destacada no mesmo prompt.


Integração com Nano Banana: edite e remova elementos
Além do direcionamento de atenção, o fluxo de marcação se conecta ao Nano Banana, tecnologia de edição do Google que facilita remoção de conteúdo em imagens e capturas de tela. Em um dos exemplos vistos no teardown, o usuário destaca um trecho específico e solicita a remoção de um item indesejado, obtendo um resultado limpo em poucos toques. Isso aproxima o Gemini de um canivete suíço de produtividade visual: entender, explicar e transformar imagens no mesmo ambiente.


Como pode funcionar no dia a dia
Profissionais e usuários comuns tendem a se beneficiar. Designers podem destacar apenas um componente visual para pedir variações de copy ou descrições acessíveis. Estudantes podem focar um parágrafo de um PDF escaneado para pedir um resumo. Técnicos podem realçar um serial number ou um conector em uma placa e solicitar identificação. Criadores podem traduzir um rótulo de embalagem sem tocar no restante da cena. Em todos os casos, a marcação reduz etapas e deixa o prompt mais óbvio, com menos chance de interpretações fora do escopo.
Conceito-chave: Região de Interesse (ROI)
A ROI delimita onde a IA deve concentrar o processamento visual. Ao cercar um objeto, o usuário reduz ruído e aumenta a precisão das respostas, similar ao Circle to Search, mas integrado ao fluxo multimodal do Gemini.
Limitações, incertezas e a natureza do APK teardown
Até o momento, a interface de marcação parece genérica, não totalmente ajustada ao diálogo com o Gemini — por exemplo, há paleta de cores sem função clara além do desenho. Também não há garantias sobre quando ou como esse fluxo será liberado. Recursos identificados em código em desenvolvimento podem ser reorganizados, postergados ou cancelados antes de uma versão pública.
Um APK teardown ajuda a prever recursos que podem chegar no futuro com base em código em desenvolvimento. Porém, é possível que esses recursos não sejam lançados publicamente.
Baseado em descoberta de código pré-lançamento
Resumo crítico: o recurso de marcação de imagem no Gemini foi encontrado em código da versão 16.42.61 do app Google. É promissor, mas não confirmado para lançamento.
Comparativo rápido: Gemini com marcação vs. fluxo atual
Fluxo atual | Fluxo com marcação |
Imagem + pergunta geral; IA infere o foco | Usuário destaca ROI; IA concentra a análise na área |
Maior risco de ambiguidade | Menos ruído e respostas mais precisas |
Edição depende de ferramentas externas | Atalhos com Nano Banana para remover conteúdo |
Quando chega? O que observar nas próximas versões
Como se trata de uma descoberta em APK teardown, não há cronograma oficial. Pontos a acompanhar: versões futuras do app Google (série 16.xx e 17.xx), menções a “image markup” ou “highlight tools” nas notas de atualização e sinais de integração profunda com o fluxo multimodal do Gemini em Android. Se o Google seguir o histórico recente, é possível que o teste surja em ondas, começando por mercados e dispositivos específicos.
Perguntas frequentes sobre Google Gemini – Circle to Search
O que é a marcação de imagem no Google Gemini?
Resposta direta: Ferramenta para destacar áreas específicas na imagem. Expansão: Ao desenhar um círculo, seta ou traço sobre um trecho, você cria uma região de interesse (ROI) para o Gemini priorizar a análise e gerar respostas focadas, reduzindo ruído visual e ambiguidade. Validação: Recurso indicado em APK teardown do app Google 16.42.61, podendo mudar antes do lançamento.
Como o recurso se compara ao Circle to Search?
Resposta direta: A lógica de destacar é semelhante. Expansão: O Circle to Search permite cercar qualquer parte da tela para buscar; no Gemini, a marcação vive no fluxo multimodal, guiando a IA ao ponto certo para explicar, traduzir ou comparar. Validação: Similaridade de uso observada nos exemplos de interface encontrados no teardown.
O Nano Banana funciona junto com a marcação?
Resposta direta: Sim, em alguns fluxos demonstrados. Expansão: Após destacar uma região, é possível acionar o Nano Banana para remover conteúdo indesejado em capturas de tela ou imagens, agilizando edições rápidas. Validação: Integração vista nos exemplos de remoção de elementos reportados no código analisado.
Quando a marcação de imagem será liberada?
Resposta direta: Ainda não há data confirmada. Expansão: Como é um achado de APK teardown, o Google pode alterar, adiar ou cancelar o recurso. Acompanhe versões futuras do app e notas oficiais. Validação: A própria natureza de recursos em código pré-lançamento implica incerteza.
Quais usos práticos a marcação destrava no Gemini?
Resposta direta: Análise focada e edição rápida. Expansão: Destacar texto para traduzir, isolar um componente para identificar, resumir apenas uma parte de um gráfico, comparar itens em catálogo e remover elementos indesejados. Validação: Casos de uso coerentes com os exemplos e com a lógica de ROI apresentada.
Considerações finais
A marcação de imagem no Gemini promete trazer o foco do Circle to Search para dentro do fluxo multimodal, combinando entendimento visual preciso com atalhos de edição via Nano Banana. Ao permitir que o usuário destaque a região de interesse, o Google reduz a ambiguidade e acelera tarefas como identificar objetos, traduzir trechos e resumir partes de gráficos. Ainda assim, trata-se de um recurso em descoberta — o código antecipa a direção, não a chegada. Se e quando a função for liberada, ela pode se tornar um dos recursos mais úteis do Gemini para produtividade visual no Android.