NoticiasTecnologia

Google apresenta Veo 3 com geração de áudio e vídeo por IA no Google I/O

PUBLICIDADE

No Google I/O 2025, o Google lançou o Veo 3, modelo de IA que produz vídeos completos e ainda gera trilhas sonoras, efeitos, ruídos e diálogos sincronizados automaticamente. A novidade, apresentada em 20 de maio de 2025, eleva o padrão de IA generativa ao integrar áudio e vídeo, destacando-se no mercado cada vez mais saturado deste tipo de tecnologia.

Veo 3 inaugura era de vídeos com áudio feito por IA

O Veo 3 marca uma evolução significativa em relação ao Veo 2, com a promessa de superar o “período silencioso” das IAs de vídeo. Agora, é possível criar clipes inserindo descrições de cenas, personagens, ambientes e até o estilo da trilha ou diálogos, com Veo 3 entregando o resultado visual e sonoro em sincronia perfeita. O acesso ao Veo 3 ocorre, inicialmente, pelo app Gemini para assinantes do plano AI Ultra (US$ 249,99/mês).

“Pela primeira vez, estamos saindo da era silenciosa da geração de vídeo. Você pode descrever personagens e ambientes, sugerir diálogos e até sons de fundo, tudo sendo processado pelo Veo 3.”

Demis Hassabis, CEO do Google DeepMind

Mercado de IA generativa para vídeo: competição intensa e diferenciais do Veo 3

O lançamento ocorre em cenário marcado pelo rápido avanço de startups como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling e Luma, além de gigantes como OpenAI e Alibaba. Embora ferramentas de geração de som e vídeo já existam, o Veo 3 se destaca pela capacidade de ler pixels e alinhar os sons criados diretamente aos momentos dos vídeos, algo ainda incomum entre rivais.

PUBLICIDADE
  • Diferencial: áudio gerado a partir da própria análise do vídeo.
  • Sincronização automática de sons com imagens.
  • Processamento de comandos textuais e imagéticos pelos usuários.
  • Disponível para assinantes avançados do Gemini.

Segundo especialistas do setor, mais que criar sons, o Veo 3 poderá impulsionar áreas como cinema, publicidade, games e mídias digitais, ao acelerar etapas da pós-produção e ampliar possibilidades criativas.

Como funciona: da tecnologia DeepMind ao vídeo com som integrado

O desenvolvimento do Veo 3 foi viabilizado por pesquisas em “video-to-audio” promovidas anteriormente pela DeepMind, braço de IA avançada do Google. Desde 2024, a equipe trabalha em algoritmos capazes de identificar padrões em imagens e cruzá-los com bancos sonoros e transcrições de falas, resultando em IA apta a sugerir e sincronizar trilhas de forma natural.

A origem dos dados de treinamento não foi revelada oficialmente, mas estima-se que conteúdo de plataformas como o YouTube tenha papel central, considerando o vasto acervo e o histórico de integração de dados entre Google e DeepMind.

Segurança: marca d’água contra deepfakes e uso responsável

Para mitigar riscos de manipulação e deepfakes, Veo 3 emprega a tecnologia SynthID, que insere marcadores invisíveis (“marca d’água digital”) nos frames dos vídeos criados. A solução reforça rastreabilidade e dificulta a apropriação indevida, garantindo responsabilidade na adoção da IA em ambientes profissionais ou criativos.

Entretanto, o avanço dessas ferramentas motiva debates sobre impacto em profissões criativas. Estudo recente da Animation Guild, sindicato de animadores dos EUA, estima que mais de 100 mil empregos do setor de entretenimento serão afetados pela automação via IA até 2026.

Atualizações para Veo 2 e integração com Vertex AI da Google

Junto ao Veo 3, novas funções do Veo 2 foram anunciadas: envio de imagens para referenciar personagens ou cenários; compreensão de movimentos de câmera; edição de objetos; e conversão de vídeo vertical para horizontal. Essas funções estarão disponíveis na plataforma Vertex AI da Google em breve, ampliando a gama de criadores e desenvolvedores que podem utilizar a tecnologia.

Tendências e próximos passos na IA para mídia audiovisual

O Veo 3 consolida a aposta da Google em IA multimodal, aproximando-se de um fluxo de criação audiovisual quase autônomo e de grande impacto em entretenimento, comunicação, publicidade e ensino. O desafio, a partir de agora, será equilibrar inovação, ética e as transformações no mercado de trabalho criativo.

Perguntas frequentes

  1. O que é o Veo 3 do Google?

    O Veo 3 é um modelo de inteligência artificial apresentado durante o Google I/O 2025, capaz de gerar vídeos e trilhas sonoras completas e sincronizadas a partir de descrições textuais, imagens ou ambos. Ele oferece áudio adaptado ao conteúdo audiovisual gerado, inovando o segmento de IA generativa.

  2. Quais as principais novidades do Veo 3 em relação ao Veo 2?

    O Veo 3 apresenta geração de áudio sincronizado automaticamente, incluindo efeitos sonoros, ruídos de fundo e diálogos, além de melhorias na qualidade visual. A versão anterior, Veo 2, agora conta também com mais recursos de edição de vídeo e será expandida para APIs da Google.

  3. Como o Veo 3 previne deepfakes e usos indevidos?

    O Veo 3 utiliza SynthID, uma tecnologia de marca d’água digital invisível nos frames dos vídeos, facilitando a detecção e rastreabilidade das criações feitas pela IA, reforçando práticas seguras e éticas em mídia digital.

  4. Quais setores podem ser mais impactados pelo Veo 3?

    O Veo 3 pode impactar cinema, animação, publicidade, produção de conteúdo digital e educação, tornando mais rápida e acessível a criação multimídia. No entanto, há debates sobre possíveis efeitos negativos em empregos tradicionais do setor.

Considerações finais

O lançamento do Veo 3 durante o Google I/O 2025 marca um salto na evolução da IA aplicada à criação audiovisual, expandindo as fronteiras criativas e seus impactos sociais. Com ferramentas mais acessíveis e recursos de segurança reforçados, o Google mira no futuro da produção digital, enquanto o debate sobre limites éticos e impactos de mercado continua ganhando força.

Diogo Fernando

Apaixonado por tecnologia e cultura pop, programo para resolver problemas e transformar vidas. Empreendedor e geek, busco novas ideias e desafios. Acredito na tecnologia como superpoder do século XXI.

Deixe um comentário