NoticiasInteligência ArtificialTecnologia

GitHub vai usar dados de usuários para treinar IA a partir de abril

PUBLICIDADE

A partir de 24 de abril de 2026, o GitHub iniciará uma nova fase no uso de inteligência artificial, utilizando dados de interação de usuários para refinar os modelos do GitHub Copilot. A política será habilitada por padrão para quem utiliza os planos Free, Pro e Pro+, mas poderá ser desativada manualmente. A mudança tem gerado debates sobre privacidade e o limite aceitável de coleta de informações na era da IA assistiva.

O que muda na política do GitHub

De acordo com comunicado assinado por Mario Rodriguez, diretor de produtos do GitHub, os dados coletados serão utilizados para tornar o Copilot mais assertivo e seguro. O objetivo é compreender fluxos reais de trabalho, aprimorar respostas e detectar falhas de código com mais eficácia. Entre as informações capturadas estão trechos de código aceitos ou rejeitados, comentários, documentação e o histórico de interações no chat do Copilot.

  • Resultados gerados pelo modelo que foram aceitos ou modificados pelo usuário;
  • Entradas fornecidas à IA, incluindo o código visível em tela;
  • Contexto do código ao redor do cursor durante a digitação;
  • Comentários feitos durante o desenvolvimento;
  • Nomes de arquivos e estrutura de diretórios;
  • Histórico de interações com ferramentas e funções do Copilot.
Tela de programação representando coleta de dados em tempo real do GitHub Copilot
A coleta ocorre apenas enquanto o usuário interage com o Copilot (Imagem: Ilya Pavlov/Unsplash)

A coleta ocorrerá exclusivamente durante o uso do Copilot, dentro do ambiente de desenvolvimento. Ou seja, os dados só são processados enquanto o assistente está ativo. Segundo o site The Register, essa prática redefine o conceito de privacidade na plataforma. Apenas usuários que desativarem manualmente o recurso terão seus repositórios protegidos integralmente.

PUBLICIDADE

Envio e armazenamento dos dados

Os dados capturados serão compartilhados entre empresas afiliadas à Microsoft, controladora do GitHub. A companhia garante que não haverá repasse a terceiros e que o tratamento seguirá as diretrizes de privacidade do ecossistema Microsoft. Os testes internos demonstraram, segundo Rodriguez, aumento nas taxas de aceitação de sugestões de código quando modelos são treinados com dados de uso real.

“Nosso objetivo é que o GitHub Copilot aprenda com experiências genuínas de desenvolvimento, oferecendo resultados mais contextualizados e úteis ao programador”, afirmou Mario Rodriguez.

Mario Rodriguez, Diretor de Produto do GitHub

A atualização segue uma tendência observada em outras empresas de IA, como a Anthropic, que também utiliza telemetria para refinar seus modelos. O GitHub anunciou que seus próprios funcionários terão os dados usados para fins de treinamento, ampliando o banco de exemplos internos para testes.

Como desativar a coleta de dados

Para quem se preocupa com privacidade, há uma forma simples de desativar o compartilhamento de dados. No painel do GitHub, é preciso acessar /settings/copilot/features e desmarcar a opção “Permitir que o GitHub use meus dados para treinamento de modelos de IA”. Esse ajuste limita a coleta de informações e impede que o código seja incluído nos conjuntos de treinamento.

Usuários que desabilitaram essa função anteriormente não precisarão repeti-la — as configurações antigas serão preservadas. Além disso, os assinantes dos planos Copilot Business, Enterprise e as contas educacionais estão automaticamente isentos dessa atualização de política.

Repercussão e comparações com o setor

A decisão gerou discussões na comunidade de desenvolvedores. Enquanto alguns veem o uso de dados reais como uma melhoria inevitável para o avanço da IA, outros consideram a medida uma violação da privacidade de código, especialmente em repositórios privados. A comparação com a Anthropic e outras empresas do setor reforça que o movimento é parte de uma tendência global de coleta supervisionada.

Essa atualização também ocorre em um contexto de reconfiguração interna do GitHub, que em 2025 ficou sem CEO e passou a ser liderado pela divisão de IA da Microsoft. Segundo analistas, a medida reforça a estratégia da gigante de Redmond de centralizar dados e otimizar o ecossistema de assistentes inteligentes em todas as suas plataformas.


Perguntas frequentes sobre GitHub vai usar dados de usuários para treinar IA

  1. Quais dados o GitHub vai coletar para treinar a IA?

    Serão coletados trechos de código aceitos ou modificados, entradas fornecidas à IA, contexto do código, comentários, nomes de arquivos e interações no chat do Copilot.

  2. Como desativar o compartilhamento dos meus dados?

    Acesse /settings/copilot/features e desmarque a opção ‘Permitir que o GitHub use meus dados para treinamento de IA’. O ajuste é imediato e preservado.

  3. A Microsoft terá acesso aos meus códigos privados?

    Os dados são compartilhados apenas entre empresas do grupo Microsoft e processados de forma criptografada durante o uso do Copilot, segundo o GitHub.

  4. Essa mudança afeta planos Business e Enterprise?

    Não. Usuários dos planos Copilot Business, Enterprise e contas educacionais estão isentos da nova política de coleta de dados.

Considerações finais

Com essa atualização, o GitHub reforça sua ambição de integrar aprendizado de máquina diretamente às práticas de desenvolvimento. Embora a coleta de dados de interação prometa gerar melhorias substanciais na precisão do Copilot, a falta de controle granular e o modelo de consentimento reverso ainda dividem opiniões. A decisão reflete um movimento crescente na indústria: transformar a própria experiência do usuário em combustível para o avanço dos sistemas de inteligência artificial.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.