Microsoft foca em superinteligência e lança novo modelo de voz
Microsoft aposta em superinteligência e lança modelo de transcrição mais eficiente, com menor custo de GPU e foco em aplicações empresariais

A Microsoft está ajustando parte de sua estratégia em inteligência artificial (IA) sob a liderança de Mustafa Suleyman, atual CEO de IA da companhia. Após uma reestruturação anunciada em meados de março, ele realocou algumas responsabilidades e passou a focar principalmente no desenvolvimento de superinteligência.
De acordo com Suleyman, essa mudança vinha sendo planejada há meses e ganhou impulso após a renegociação do contrato com a OpenAI. “Esse tem sido um plano de longa data”, disse ele, ressaltando que o conceito de superinteligência está diretamente ligado à capacidade dos modelos de entregar valor prático para empresas e usuários.
Embora termos como superinteligência e inteligência geral artificial (AGI) ainda careçam de definições claras na indústria, o executivo afirma que o foco da Microsoft está em aplicações concretas. O objetivo é fornecer a desenvolvedores, empresas e consumidores modelos de linguagem capazes de gerar resultados em grande escala.
Novo modelo de transcrição
A Microsoft lançou o MAI-Transcribe-1, um modelo de transcrição que, segundo a empresa, representa um avanço no reconhecimento de fala. Conforme explicou Mustafa Suleyman, a tecnologia funciona com aproximadamente metade do custo de GPU em relação a outros modelos de ponta, oferecendo uma economia significativa em operações.
O modelo foi projetado para lidar com condições desafiadoras de áudio, como ruído de fundo, baixa qualidade e sobreposição de falas. Ele consegue transcrever reuniões, gerar legendas para vídeos e analisar interações em call centers em 25 idiomas.
O treinamento combinou transcrições revisadas por humanos com conteúdos gerados por máquinas. Os dados utilizados incluem gravações em estúdios controlados, áudios captados em ambientes ruidosos, como ruas movimentadas e residências, além de fontes públicas disponíveis na internet.
Estratégia e desenvolvimento
A reestruturação da Microsoft também reuniu as equipes voltadas a consumidores e empresas sob a marca Copilot. Como resultado, parte das operações passou a ser liderada por Jacob Andreou, enquanto Mustafa Suleyman concentra seus esforços no desenvolvimento de novos modelos de ponta.

O MAI-Transcribe-1 passa a integrar o portfólio da Microsoft ao lado dos modelos MAI-Voice-1 e MAI-Image-2, disponíveis na plataforma Microsoft Foundry e no novo Microsoft AI Playground. Segundo a empresa, é a primeira vez que esses modelos estão amplamente acessíveis para uso comercial.
Suleyman atribui parte do desempenho do novo modelo a uma equipe enxuta, composta por cerca de dez pessoas, dedicada exclusivamente ao desenvolvimento. Ele explica que o grupo trabalha com menos burocracia, enquanto outras equipes dão suporte em atividades como coleta de dados e gerenciamento de fornecedores.
Visão para o futuro
A estratégia da Microsoft acompanha movimentos semelhantes de outras empresas do setor, como Meta, Amazon e Google, que vêm testando estruturas organizacionais mais enxutas para acelerar o desenvolvimento de IA.
Suleyman afirma que o objetivo é criar sistemas de IA centrados no usuário. “Todos terão um assistente de IA no bolso, de classe mundial, responsável e alinhado aos seus interesses”, disse ele. A proposta, segundo o executivo, é fornecer ferramentas que atuem diretamente em benefício dos usuários.
Fonte: Olhar Digital
Previous Post
Next Post