NoticiasInteligência ArtificialTecnologia

Microsoft lança três novos modelos de IA para competir com Google e OpenAI

PUBLICIDADE

A Microsoft AI, divisão de pesquisa da gigante tecnológica, anunciou o lançamento de três novos modelos de inteligência artificial nesta quinta-feira (2 de abril de 2026). A iniciativa fortalece a posição da empresa na corrida global da IA, marcando um avanço estratégico frente aos seus rivais diretos — Google e OpenAI. Os modelos, batizados de MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2, integram a nova linha de modelos fundacionais multimodais que prometem transformar a forma como a IA é aplicada em texto, áudio e imagem.

O que são os novos modelos MAI?

Segundo o comunicado oficial divulgado pela Microsoft, o MAI-Transcribe-1 é um modelo capaz de transcrever áudio em texto em até 25 idiomas, com desempenho 2,5 vezes mais rápido do que a solução Azure Fast já oferecida pela companhia. Já o MAI-Voice-1 se destaca por gerar áudio — permitindo que usuários produzam até 60 segundos de som em apenas um segundo e criem vozes personalizadas para uso em diferentes aplicações. Por sua vez, o MAI-Image-2 foi projetado para gerar vídeos e imagens a partir de comandos textuais, representando um salto na IA multimodal da empresa.

Integração com o MAI Playground e Foundry

Os modelos fazem parte do ecossistema MAI Playground e da plataforma Microsoft Foundry. O Image-2 já havia estreado de forma experimental no Playground em 19 de março, permitindo aos desenvolvedores testar suas capacidades. Agora, todos os três modelos estão amplamente disponíveis: o Voice-1 e o Transcribe-1 também podem ser acessados na ferramenta interativa.

PUBLICIDADE

Os preços de entrada são agressivos: o MAI-Transcribe-1 custa US$ 0,36 por hora de uso; o MAI-Voice-1, US$ 22 por milhão de caracteres; e o MAI-Image-2, US$ 5 por milhão de tokens de entrada e US$ 33 por milhão de tokens de saída de imagem. Essa estratégia de precificação competitiva reflete o posicionamento da Microsoft para atrair startups e empresas interessadas em IA de alto desempenho a custos menores.

O papel de Mustafa Suleyman na estratégia de IA

A liderança desse movimento vem de Mustafa Suleyman, atual CEO da Microsoft AI e cofundador da DeepMind. Desde a criação da equipe de superinteligência da empresa, em novembro de 2025, Suleyman trabalha na orientação do conceito que ele chama de Humanist AI — uma abordagem de IA desenvolvida com foco no ser humano, priorizando usabilidade e comunicação natural. Em texto publicado no blog da Microsoft AI, Suleyman reforçou: “Estamos construindo uma IA humanista. Queremos que nossos modelos sejam otimizados para a forma como as pessoas realmente se comunicam e criam.”

“Nos próximos meses, vocês verão mais modelos da Microsoft AI sendo lançados no Foundry e integrados diretamente em nossos produtos e experiências”, acrescentou Suleyman.

Mustafa Suleyman, CEO da Microsoft AI

Competição feroz no mercado de IA generativa

Com o crescimento explosivo de soluções de IA generativa, a Microsoft busca estabelecer independência tecnológica sem romper sua histórica parceria com a OpenAI. Mesmo após investir mais de US$ 13 bilhões na startup de Sam Altman, a empresa de Redmond agora diversifica seu portfólio, criando modelos próprios enquanto mantém acordos com fornecedores externos — uma estratégia semelhante à adotada no mercado de chips, onde a Microsoft produz seus próprios semicondutores, mas continua comprando de marcas como Nvidia e AMD.

Durante entrevista à VentureBeat, Suleyman reafirmou que a cooperação com a OpenAI segue sólida, especialmente em áreas de pesquisa compartilhada. No entanto, ele destacou que a recente renegociação do contrato entre as duas organizações abriu espaço para a Microsoft explorar iniciativas internas de superinteligência com mais autonomia.

Impacto potencial e próximos passos

Com a chegada dos novos modelos, a Microsoft reforça seu compromisso em liderar a próxima era da inteligência artificial. A empresa planeja integrar o MAI-Transcribe-1 e o MAI-Voice-1 em diversos produtos de seu ecossistema, como o Office, Teams e Copilot, permitindo maior personalização, automação e acessibilidade. Já o MAI-Image-2 deve impulsionar ferramentas criativas e gerar novas oportunidades para o setor de mídia, design e publicidade digital.

Em um mercado avaliado em mais de US$ 200 bilhões, as ambições da Microsoft AI não se limitam a acompanhar a concorrência: a empresa quer moldar o futuro da interação homem-máquina. Ao direcionar seus esforços para um modelo de IA centrado no usuário, Suleyman posiciona a companhia como um dos protagonistas dessa transformação.

Perguntas frequentes sobre os novos modelos de IA da Microsoft

  1. O que é o MAI-Transcribe-1?

    Trata-se de um modelo de transcrição de fala em texto capaz de compreender até 25 idiomas simultaneamente e oferecer performance 2,5 vezes superior à geração anterior da Microsoft.

  2. Como funciona o MAI-Voice-1?

    É um modelo generativo de áudio que cria até 60 segundos de som em um segundo e permite personalizar vozes. Ideal para automação de voz, podcasts e marketing digital.

  3. O MAI-Image-2 gera imagens ou vídeos?

    O modelo é multimodal. Ele gera tanto imagens estáticas quanto sequências de vídeo com base em texto, ampliando o potencial criativo de ferramentas de design assistido.

  4. Esses modelos competem diretamente com o GPT-4 e o Gemini?

    Sim. O objetivo da Microsoft é oferecer desempenho e custo mais vantajosos, combinando capacidades generativas e de aprendizado em múltiplos formatos.

  5. Quando estarão disponíveis ao público?

    Os três modelos já podem ser acessados pelo Microsoft Foundry, e dois deles — Transcribe e Voice — também estão disponíveis no MAI Playground para desenvolvedores.

Considerações finais

A Microsoft AI dá um passo decisivo rumo à consolidação de um portfólio robusto de modelos fundacionais. Ao lado de Mustafa Suleyman, a empresa busca combinar tecnologia avançada com propósito humano. A chegada dos modelos MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2 marca o início de uma nova fase onde eficiência, custo acessível e ética tecnológica caminham lado a lado. O mercado observa atentamente os desdobramentos dessa rivalidade que promete redefinir o cenário global da inteligência artificial em 2026.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.