Cohere lança Transcribe, modelo open-source de voz para transcrição
A Cohere, empresa de inteligência artificial voltada ao mercado corporativo, anunciou nesta quinta-feira o lançamento do Transcribe, seu primeiro modelo de voz de código aberto. O recurso foi projetado para tarefas de reconhecimento automático de fala (ASR), incluindo transcrição, anotações e análise de áudio. O Transcribe chama atenção por combinar leveza técnica e alto desempenho, com apenas 2 bilhões de parâmetros, tornando-o acessível para uso em GPUs domésticas comuns.
Tabela de conteúdos
Desempenho e compatibilidade do modelo de voz
O Cohere Transcribe foi desenvolvido para atender tanto pesquisadores quanto empresas que desejam executar modelos de transcrição localmente, sem depender de plataformas externas. Ele suporta 14 idiomas — incluindo inglês, francês, alemão, espanhol, português, chinês e árabe — e foi projetado com foco em eficiência de custo e desempenho. De acordo com dados da empresa, o modelo pode processar até 525 minutos de áudio em apenas um minuto, um tempo de execução impressionante para a categoria.
Nos testes conduzidos no benchmark Hugging Face Open ASR Leaderboard, o Transcribe alcançou um Word Error Rate (WER) médio de 5,42 — o menor entre os modelos testados, superando rivais como o Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 e Qwen3-ASR-1.7B Speech. Em avaliações humanas, o Transcribe teve uma taxa média de acerto de 61% em relação à precisão e coerência das transcrições.
Comparativo com modelos concorrentes
No comparativo direto, o Transcribe ficou atrás de alguns concorrentes ao lidar com transcrições em português, alemão e espanhol, mas manteve vantagem em estabilidade e velocidade. Segundo a Cohere, o modelo foi otimizado para processar fluxo contínuo de áudio, o que o torna ideal para aplicações de análise de reuniões corporativas, legendagem automática e assistentes de voz.
Acesso aberto e integração com ferramentas da Cohere
O modelo já está disponível gratuitamente via API da Cohere e também pode ser acessado pelo Model Vault, a plataforma gerenciada da empresa. A Cohere afirmou que o Transcribe será incorporado à sua plataforma de orquestração de agentes empresariais, North, permitindo integração completa entre voz e automação de tarefas corporativas baseadas em IA.
Esse lançamento vem em meio a um momento de forte crescimento da empresa no mercado de IA empresarial. Rumores apontam que a Cohere registrou uma receita recorrente anual de US$ 240 milhões em 2025 e planeja abrir capital em breve, segundo o CEO Aidan Gomez. O Transcribe surge, portanto, como um passo estratégico antes da possível IPO.
Contexto: crescimento da demanda por transcrição via IA
Nos últimos anos, o uso de modelos de reconhecimento de voz disparou. Aplicativos como Granola e Wispr Flow, que permitem gravação e transcrição automatizadas, mostram a tendência de profissionais e empresas por ferramentas que economizem tempo e melhorem a produtividade. A aposta da Cohere em lançar um modelo de código aberto visa não apenas aumentar sua presença em pesquisa aplicada, mas também consolidar sua marca no ecossistema de IA acessível e transparente.
O modelo Cohere Transcribe em números
| Parâmetros | 2 bilhões |
| Idiomas suportados | 14 |
| Taxa média de erro (WER) | 5,42 |
| Desempenho (áudio/min) | 525 minutos processados por minuto |
| Disponibilidade | API gratuita e Model Vault |
Com suas especificações, o Transcribe se posiciona como um modelo ideal para laboratórios, startups e equipes corporativas que buscam autonomia na gestão de dados e integração com pipelines personalizados de IA.
Perspectivas para o futuro da Cohere
A Cohere vem se consolidando como uma das principais concorrentes no segmento de IA generativa, competindo diretamente com empresas como OpenAI e Anthropic. O lançamento do Transcribe reflete um movimento de abertura e democratização do acesso à tecnologia, algo que tem atraído a atenção de desenvolvedores e pesquisadores.
Com a combinação de eficiência, código aberto e integração corporativa, a empresa aposta que o Transcribe será amplamente adotado em sistemas de assistentes de voz, plataformas de análise de dados e soluções voltadas para acessibilidade digital.
Perguntas frequentes sobre o Cohere Transcribe
O modelo Cohere Transcribe é gratuito?
Sim. O Transcribe está disponível gratuitamente por meio da API oficial da Cohere e também pode ser acessado via plataforma Model Vault.
Quantos idiomas o Transcribe suporta?
Atualmente, o modelo suporta 14 idiomas, entre eles inglês, francês, português, chinês, japonês e árabe.
Qual é a principal vantagem do Transcribe?
Sua leveza técnica — com apenas 2 bilhões de parâmetros — permite uso em GPUs de consumo sem perder desempenho ou precisão nas transcrições.
O modelo pode ser hospedado localmente?
Sim. Ele é projetado para operação autônoma em servidores corporativos ou máquinas pessoais, garantindo maior privacidade e controle.
Considerações finais
O lançamento do Cohere Transcribe marca um passo importante no cenário de inteligência artificial voltada à comunicação e acessibilidade. Com um modelo open-source capaz de competir com grandes players de mercado e desempenho superior em benchmarks, a iniciativa reforça a tendência de descentralização da IA e o potencial de uso corporativo da tecnologia de reconhecimento de voz. Para desenvolvedores, educadores e empresas, o Transcribe representa uma nova fronteira entre eficiência, abertura e poder computacional equilibrado.

