Microsoft lança modelos de IA MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2 para competir com OpenAI e Google, buscando autonomia e velocidade

Ouvir conteúdo

Microsoft lança modelos de IA integrados ao Microsoft Foundry e MAI Playground, prometendo transcrição 2,5 vezes mais rápida, voz acelerada e imagens mais velozes

Microsoft lança modelos de IA com a apresentação de três soluções internas para fala, voz e imagem, destinadas a desenvolvedores e empresas que usam o Azure.

As novidades chegam ao Microsoft Foundry e ao MAI Playground, ambiente de testes criado pela companhia, e representam o primeiro resultado prático da equipe de superinteligência formada em novembro de 2025.

Esses lançamentos sinalizam a busca da Microsoft por maior autonomia em IA, reduzindo dependência de parceiros externos, enquanto mantém acordos estratégicos de longo prazo.

conforme informação divulgada por Marcelo Fischer Salvatico.

O que cada modelo faz

O MAI-Transcribe-1 converte fala em texto em 25 idiomas e, segundo a Microsoft, opera 2,5 vezes mais rápido do que a oferta Azure Fast.

Nos benchmarks internos da empresa, o modelo supera o Whisper da OpenAI nos 25 idiomas avaliados e vence o Gemini do Google em 22 deles.

O preço de entrada é de US$ 0,36 por hora, segundo os dados divulgados.

O MAI-Voice-1 gera áudio a partir de texto e consegue produzir 60 segundos de fala em um segundo.

Também suporta criação de voz personalizada a partir de poucos segundos de gravação, tornando mais simples a geração de falas com timbres específicos.

O modelo custa US$ 22 por milhão de caracteres processados, segundo as informações tornadas públicas.

Já o MAI-Image-2, voltado para criação de imagens, tem o dobro da velocidade de geração da versão anterior.

O preço começa em US$ 5 por milhão de tokens de entrada de texto, e US$ 33 por milhão de tokens de saída de imagem, conforme os valores informados pela Microsoft.

Parceria com OpenAI segue, mas com novas regras

A renegociação do contrato com a OpenAI, concluída em outubro de 2025, foi o que permitiu à Microsoft partir para o desenvolvimento próprio de modelos de fronteira.

O novo acordo mantém a parceria e o acesso aos modelos da OpenAI, até 2032, mas abre espaço para que a Microsoft construa sua própria stack de modelos.

A empresa, que já investiu mais de US$ 13 bilhões na OpenAI, agora combina acesso externo com iniciativas internas para diversificar sua oferta.

Mustafa Suleyman, que assumiu a divisão de IA e formou a equipe de superinteligência em novembro de 2025, afirmou que os times por trás dos novos lançamentos são pequenos, menos de dez pessoas em cada um, incluindo o de áudio e o de imagem.

A Microsoft não confirmou data para um modelo de linguagem próprio voltado para tarefas gerais, mantendo a porta aberta para futuras entregas.

Impacto para empresas, desenvolvedores e mercado

A chegada dos modelos ao Microsoft Foundry e ao MAI Playground facilita testes e integração por parte de empresas que já usam Azure, e também por desenvolvedores que buscam reduzir latência e custos.

Ao posicionar alternativas internas à OpenAI e ao Google, a Microsoft tenta equilibrar segurança de fornecimento, controle de tecnologia e potencial redução de despesas em escala.

Os preços anunciados, como US$ 0,36 por hora na transcrição e US$ 22 por milhão de caracteres na geração de voz, permitem estimativas diretas de custo para aplicações em call centers, assistentes virtuais e edição de áudio automatizada.

Para geração de imagens, os valores por token indicam uma abordagem de precificação que separa texto de entrada e imagens de saída, o que pode alterar cálculos de custo para fluxos criativos automatizados.

O que observar adiante

É importante acompanhar a performance real desses modelos em testes independentes, porque os números divulgados são, em grande parte, baseados em benchmarks internos da Microsoft.

A interoperabilidade com ferramentas já existentes no Azure e a facilidade de personalização serão fatores decisivos para adoção em larga escala.

Também vale observar a evolução do acordo com a OpenAI, e como a Microsoft equilibrará colaboração e concorrência nos próximos anos, especialmente até 2032, prazo de acesso citado no novo contrato.

Em resumo, essas novidades mostram que a Microsoft busca ampliar sua presença na infraestrutura de IA, oferecendo alternativas competitivas em transcrição, voz e imagem, ao mesmo tempo em que preserva laços estratégicos com parceiros externos.

Os próximos meses devem revelar se as promessas de velocidade, custo e qualidade se confirmam fora dos laboratórios da empresa, e como o mercado vai reagir a mais uma frente de competição entre grandes fornecedores de IA.

Compartilhe nosso conteúdo

Ultimas notícias