Microsoft lança modelos de IA integrados ao Microsoft Foundry e MAI Playground, prometendo transcrição 2,5 vezes mais rápida, voz acelerada e imagens mais velozes
Microsoft lança modelos de IA com a apresentação de três soluções internas para fala, voz e imagem, destinadas a desenvolvedores e empresas que usam o Azure.
As novidades chegam ao Microsoft Foundry e ao MAI Playground, ambiente de testes criado pela companhia, e representam o primeiro resultado prático da equipe de superinteligência formada em novembro de 2025.
Esses lançamentos sinalizam a busca da Microsoft por maior autonomia em IA, reduzindo dependência de parceiros externos, enquanto mantém acordos estratégicos de longo prazo.
conforme informação divulgada por Marcelo Fischer Salvatico.
O que cada modelo faz
O MAI-Transcribe-1 converte fala em texto em 25 idiomas e, segundo a Microsoft, opera 2,5 vezes mais rápido do que a oferta Azure Fast.
Nos benchmarks internos da empresa, o modelo supera o Whisper da OpenAI nos 25 idiomas avaliados e vence o Gemini do Google em 22 deles.
O preço de entrada é de US$ 0,36 por hora, segundo os dados divulgados.
O MAI-Voice-1 gera áudio a partir de texto e consegue produzir 60 segundos de fala em um segundo.
Também suporta criação de voz personalizada a partir de poucos segundos de gravação, tornando mais simples a geração de falas com timbres específicos.
O modelo custa US$ 22 por milhão de caracteres processados, segundo as informações tornadas públicas.
Já o MAI-Image-2, voltado para criação de imagens, tem o dobro da velocidade de geração da versão anterior.
O preço começa em US$ 5 por milhão de tokens de entrada de texto, e US$ 33 por milhão de tokens de saída de imagem, conforme os valores informados pela Microsoft.
Parceria com OpenAI segue, mas com novas regras
A renegociação do contrato com a OpenAI, concluída em outubro de 2025, foi o que permitiu à Microsoft partir para o desenvolvimento próprio de modelos de fronteira.
O novo acordo mantém a parceria e o acesso aos modelos da OpenAI, até 2032, mas abre espaço para que a Microsoft construa sua própria stack de modelos.
A empresa, que já investiu mais de US$ 13 bilhões na OpenAI, agora combina acesso externo com iniciativas internas para diversificar sua oferta.
Mustafa Suleyman, que assumiu a divisão de IA e formou a equipe de superinteligência em novembro de 2025, afirmou que os times por trás dos novos lançamentos são pequenos, menos de dez pessoas em cada um, incluindo o de áudio e o de imagem.
A Microsoft não confirmou data para um modelo de linguagem próprio voltado para tarefas gerais, mantendo a porta aberta para futuras entregas.
Impacto para empresas, desenvolvedores e mercado
A chegada dos modelos ao Microsoft Foundry e ao MAI Playground facilita testes e integração por parte de empresas que já usam Azure, e também por desenvolvedores que buscam reduzir latência e custos.
Ao posicionar alternativas internas à OpenAI e ao Google, a Microsoft tenta equilibrar segurança de fornecimento, controle de tecnologia e potencial redução de despesas em escala.
Os preços anunciados, como US$ 0,36 por hora na transcrição e US$ 22 por milhão de caracteres na geração de voz, permitem estimativas diretas de custo para aplicações em call centers, assistentes virtuais e edição de áudio automatizada.
Para geração de imagens, os valores por token indicam uma abordagem de precificação que separa texto de entrada e imagens de saída, o que pode alterar cálculos de custo para fluxos criativos automatizados.
O que observar adiante
É importante acompanhar a performance real desses modelos em testes independentes, porque os números divulgados são, em grande parte, baseados em benchmarks internos da Microsoft.
A interoperabilidade com ferramentas já existentes no Azure e a facilidade de personalização serão fatores decisivos para adoção em larga escala.
Também vale observar a evolução do acordo com a OpenAI, e como a Microsoft equilibrará colaboração e concorrência nos próximos anos, especialmente até 2032, prazo de acesso citado no novo contrato.
Em resumo, essas novidades mostram que a Microsoft busca ampliar sua presença na infraestrutura de IA, oferecendo alternativas competitivas em transcrição, voz e imagem, ao mesmo tempo em que preserva laços estratégicos com parceiros externos.
Os próximos meses devem revelar se as promessas de velocidade, custo e qualidade se confirmam fora dos laboratórios da empresa, e como o mercado vai reagir a mais uma frente de competição entre grandes fornecedores de IA.











