Microsoft MAI: Os 7 Modelos Próprios do Build 2026 e o “Divórcio” Lento com a OpenAI
No dia 2 de junho de 2026, no palco do Build em San Francisco, a Microsoft fez o que vinha ensaiando há quase dois anos: parou de depender da OpenAI para ter modelos de fronteira. A empresa anunciou a família Microsoft MAI — sete modelos próprios, treinados do zero, cobrindo raciocínio, geração de código, criação de imagem, voz e transcrição. Não são ajustes em cima de tecnologia alheia: segundo a Microsoft, todos foram treinados em dados licenciados comercialmente, sem destilação de nenhum outro laboratório de IA.
O recado é direto. Mustafa Suleyman, CEO da Microsoft AI, resumiu em entrevista durante o evento: a divisão dele foi “libertada” do contrato com a OpenAI há cerca de seis meses para perseguir formalmente o que ele chama de superinteligência. Para quem programa, usa Copilot ou roda cargas de IA na Azure, isso não é fofoca corporativa — é uma mudança que mexe em custo, velocidade e em quem dita o roadmap dos produtos que você usa todo dia. Vamos destrinchar.
O Que a Microsoft Anunciou: A Família MAI em Sete Peças
A jogada da Microsoft não foi tentar bater o GPT-5.5 num único modelo gigante de propósito geral. Foi montar uma família especializada, cada modelo otimizado para uma tarefa e — o ponto central — para custo. Os sete:
1. MAI-Thinking-1 (raciocínio, o carro-chefe)
O primeiro modelo de raciocínio da Microsoft. É um modelo de tamanho médio com 35 bilhões de parâmetros ativos (arquitetura mixture-of-experts) e janela de contexto de 256 mil tokens, desenhado para alta eficiência a baixo custo por token. Os números que a Microsoft divulgou: cerca de 97% no AIME 2025 (matemática) e 53% no SWE-bench Pro, índice de engenharia de software que, segundo Suleyman, coloca o modelo “lado a lado com o Opus 4.6” da Anthropic. Em testes cegos com avaliadores humanos, a Microsoft afirma que o MAI-Thinking-1 foi preferido ao Claude Sonnet 4.6. Ele está em preview privado no Microsoft Foundry.
2. MAI-Code-1-Flash (código)
O modelo que mais interessa a quem programa. É um modelo de código leve, de 5 bilhões de parâmetros ativos, ajustado para o GitHub e otimizado para inferência rápida e barata. Ele gera código a partir de descrição em linguagem natural e já está chegando ao GitHub Copilot e ao VS Code pelo seletor de modelos. A Microsoft o posiciona como melhor custo-benefício do que modelos rivais da faixa econômica: na cobrança por uso do Copilot, diz a empresa, ele sai mais barato que o Claude Haiku 4.5.
3 e 4. MAI-Image-2.5 e MAI-Image-2.5 Flash (imagem)
Os primeiros modelos de imagem da casa a servir tanto texto-para-imagem quanto imagem-para-imagem (edição). A Microsoft reporta posições de topo no leaderboard da LMArena — entre os melhores em geração e em edição. Já estão ativos no PowerPoint e em expansão para o OneDrive.
5. MAI-Transcribe-1.5 (transcrição)
Modelo de transcrição com precisão de ponta em 43 idiomas, com transcrição em streaming a caminho.
6 e 7. MAI-Voice-2 e MAI-Voice-2 Flash (voz)
A evolução da linha de voz, agora com geração de fala em 15 idiomas e novas opções de vozes (a Microsoft promete mais idiomas em breve). A linhagem vem do MAI-Voice-1, o primeiro modelo 100% interno da Microsoft, lançado em agosto de 2025 — capaz de gerar um minuto de áudio em menos de um segundo numa única GPU.
O Argumento Real: Custo
O número que a Microsoft mais repetiu não foi de benchmark — foi de preço. Suleyman afirmou que, quando ajustados aos padrões de avaliação da McKinsey, os modelos MAI atingiram “a maior taxa de vitória de qualquer modelo testado, a um custo cerca de dez vezes menor”. A empresa também citou versões ajustadas para Excel rodando até dez vezes mais eficientemente que o GPT da OpenAI no mesmo tipo de tarefa.
Vale ler isso com ceticismo saudável: são benchmarks internos, em cenários escolhidos pela própria Microsoft, e “preferido por avaliadores humanos” não é a mesma coisa que liderar um ranking público independente. Mas a direção é clara e plausível. Modelos menores e especializados, rodando na infraestrutura da própria Microsoft, têm estrutura de custo radicalmente diferente de pagar royalties de licenciamento para um modelo de fronteira de terceiros a cada chamada de API.
E aqui está o pulo do gato estratégico: rodar nos data centers da própria Microsoft, com silício próprio, elimina o pagamento a fornecedores externos — leia-se OpenAI — em uma fatia cada vez maior das cargas. Para uma empresa que processa bilhões de chamadas de IA por dia entre Copilot, Office, GitHub e Azure, cada centavo por token vira bilhões na conta anual.
O Contexto: O “Divórcio” Lento Microsoft–OpenAI
Para entender por que isso é grande, precisa rebobinar. A Microsoft foi a maior investidora da OpenAI desde 2019 e construiu Copilot, Office e boa parte da narrativa de IA da Azure em cima do GPT. Era uma dependência confortável — até deixar de ser.
A virada começou a formalizar-se em outubro de 2025, quando as duas empresas reestruturaram a parceria. A OpenAI virou uma corporação de benefício público e a Microsoft ficou com uma fatia de cerca de 27%, avaliada em torno de US$ 135 bilhões. O ponto crucial: a Microsoft perdeu o direito de ser automaticamente a nuvem padrão da OpenAI (que, em troca, se comprometeu a comprar US$ 250 bilhões em capacidade Azure), e — segundo Suleyman — a divisão de IA da Microsoft foi liberada para perseguir superinteligência por conta própria, com seus próprios pesquisadores e infraestrutura.
Em novembro de 2025, a Microsoft montou o “MAI Superintelligence Team” sob Suleyman, o cofundador da DeepMind que chegou à empresa em 2024 trazendo o time da Inflection AI. Em abril de 2026, novo capítulo: a OpenAI renegociou o compartilhamento de receita, colocando teto nos pagamentos à Microsoft. A relação não terminou — a OpenAI segue parceira de modelos de fronteira e a Microsoft mantém direitos de propriedade intelectual estendidos —, mas deixou de ser um casamento exclusivo. É um divórcio lento, civilizado, com guarda compartilhada de produtos.
Esse rearranjo de poder lembra o que vimos na captação recorde da OpenAI, em que a própria Microsoft reinvestiu mesmo diversificando — vale ler nossa análise sobre a OpenAI avaliada em US$ 852 bilhões para entender os dois lados da mesa.
O Que Isso Significa para o Copilot e a Azure
Para o usuário final, a mudança é quase invisível por design. A estratégia da Microsoft é rotear cada tarefa para o modelo certo: o MAI-Code-1-Flash para autocomplete e tarefas simples de código; modelos maiores (próprios ou da OpenAI) para raciocínio pesado. Você continua vendo “Copilot” — por baixo, quem responde muda conforme custo, velocidade, privacidade e necessidade de customização.
Na Azure e no Foundry, devs ganham mais opções no seletor de modelos. O MAI-Code-1-Flash entrando no Copilot e no VS Code chega num momento sensível: poucos dias antes, em 1º de junho de 2026, o GitHub migrou o Copilot para cobrança por uso (por tokens), reacendendo o receio de contas mais altas em fluxos agênticos. Um modelo de código ultraeficiente e barato é resposta direta a essa ansiedade.
No Windows, a Microsoft empurra agentes como o Scout, integrados a Teams, Outlook e desktop. Quanto mais barato rodar a inferência, mais agressivamente a empresa pode embutir IA em tudo sem estourar a margem. É a lógica de quem controla a própria fábrica de modelos.
O Que os Desenvolvedores Ganham
Tirando o ruído corporativo, o que sobra de concreto para quem codifica:
1. Código mais barato no fluxo do dia a dia. Um modelo de 5 bilhões de parâmetros ajustado para o GitHub significa autocomplete, geração de boilerplate e refatoração simples a uma fração do custo de chamar um modelo de fronteira. Para times que rodam Copilot em escala, a economia é real.
2. Mais concorrência, melhores preços. Com a Microsoft, a OpenAI, a Anthropic e o Google brigando dentro do mesmo seletor de modelos, a pressão de preço favorece o dev. Saber qual modelo usar para qual tarefa virou habilidade — nosso comparativo de qual é o melhor modelo de IA em 2026 ajuda a escolher.
3. Modelos especializados como padrão. A aposta da Microsoft confirma uma tendência: o futuro não é um modelo gigante para tudo, e sim o modelo certo para cada tarefa. Quem souber orquestrar essa “frota” de modelos — incluindo os agentes de IA autônomos que combinam vários deles — sai na frente.
4. Menos lock-in (em tese). Mais fornecedores de peso significam mais alavancagem para negociar e migrar. Na prática, a Microsoft quer prender você no ecossistema dela — então o ganho de liberdade é relativo.
Os Riscos e Pontos de Atenção
Nem tudo são boas notícias para quem está de fora:
- Benchmarks de marketing. As comparações da Microsoft com Sonnet 4.6, Opus 4.6 e GPT são, em boa parte, internas e em cenários favoráveis. “Preferido por avaliadores humanos” e “ajustado aos padrões da McKinsey” não substituem rankings públicos independentes. Trate os números com cautela até verificação de terceiros.
- Maturidade. O MAI-Thinking-1 está em preview privado. Disponibilidade ampla, preços finais e estabilidade em produção ainda são incógnitas.
- Concentração de poder. O divórcio Microsoft–OpenAI não democratiza a IA: apenas troca um gigante por outro com modelos próprios. O frontier de IA segue nas mãos de meia dúzia de empresas. É o tipo de cenário que atrai olhares regulatórios — vale acompanhar a regulação de IA nos EUA em 2026.
- Fragmentação. Mais modelos no seletor é bom para preço, mas aumenta a complexidade. Escolher errado pode custar caro em qualidade ou em conta de API.
Perguntas Frequentes
O que é a família Microsoft MAI?
MAI (Microsoft AI) é a linha de modelos próprios da Microsoft, treinados do zero internamente. No Build 2026, a empresa anunciou sete modelos cobrindo raciocínio (MAI-Thinking-1), código (MAI-Code-1-Flash), imagem (MAI-Image-2.5 e Flash), transcrição (MAI-Transcribe-1.5) e voz (MAI-Voice-2 e Flash).
A Microsoft rompeu com a OpenAI?
Não rompeu, mas reduziu drasticamente a dependência. A parceria foi reestruturada em outubro de 2025 (Microsoft com ~27% da OpenAI) e teve a receita recapeada em abril de 2026. A OpenAI segue como parceira de modelos de fronteira, mas a Microsoft agora pode perseguir superinteligência por conta própria e rotear cargas para seus modelos MAI quando custo, velocidade ou privacidade pesarem mais.
O MAI-Code-1-Flash já está disponível?
Está chegando ao GitHub Copilot e ao VS Code pelo seletor de modelos. É um modelo de 5 bilhões de parâmetros voltado para código rápido e barato. O MAI-Thinking-1, de raciocínio, está em preview privado no Microsoft Foundry.
Os modelos MAI são melhores que GPT-5.5 ou Claude?
Pelos benchmarks da própria Microsoft, o MAI-Thinking-1 empata com o Opus 4.6 em código (53% no SWE-bench Pro) e supera o Sonnet 4.6 em testes cegos. A McKinsey, segundo a Microsoft, viu os modelos vencerem a um custo cerca de dez vezes menor. São números internos: aguarde verificação independente antes de concluir.
Por que a Microsoft quer modelos próprios?
Três motivos: cortar o custo de pagar royalties à OpenAI a cada chamada, ganhar autonomia estratégica (rodar tudo nos próprios data centers e silício) e poder embutir IA em Copilot, Office e Windows com margem sustentável. É autossuficiência de longo prazo.
Isso barateia a IA para desenvolvedores?
Tende a baratear nas tarefas comuns. Um modelo de código de 5 bilhões de parâmetros custa muito menos que um modelo de fronteira para autocomplete e geração simples. E mais concorrência no seletor de modelos pressiona preços para baixo no geral.
O Que Acompanhar a Partir de Agora
A família MAI é uma declaração de independência — mas declarações precisam ser sustentadas por execução. Três coisas para monitorar nos próximos meses:
- Verificação independente dos benchmarks. Quando o MAI-Thinking-1 sair do preview e cair em rankings públicos (LMArena, SWE-bench oficial), saberemos se os números de marketing se confirmam.
- Preço final e disponibilidade no Foundry e na Azure. A promessa de “dez vezes mais barato” só vira vantagem real quando o tabelamento público aparecer.
- O próximo passo do divórcio com a OpenAI. Cada renegociação aproxima as duas empresas de concorrentes diretas. Como a OpenAI responde — preços, exclusividades, novos parceiros de nuvem — define o próximo capítulo.
Para acompanhar as próximas atualizações, assine a newsletter do iabrief — 1 email por semana, sem hype, com o que importa.