Meta lança Muse Spark: o novo modelo de IA proprietário que pode aposentar o Llama

Novo modelo foi desenvolvido por Meta Superintelligence Labs (MSL) e é o mais poderoso já lançado pela empresa

A Meta tem sido uma das empresas mais interessantes da era da IA generativa — inicialmente conquistando uma base enorme e leal de usuários com o lançamento da família de modelos de linguagem de grande porte (LLMs) Llama, em sua maioria open source, no início de 2023. No entanto, essa trajetória chegou a uma parada brusca no ano passado após o Llama 4 estrear com avaliações mistas e, finalmente, admissões de manipulação de benchmarks.

Esse lançamento problemático do Llama 4 aparentemente motivou o fundador e CEO da Meta, Mark Zuckerberg, a reformular completamente as operações de IA da Meta no verão de 2025, formando uma nova divisão interna, o Meta Superintelligence Labs (MSL), para a qual recrutou Alexandr Wang, ex-cofundador e CEO da Scale AI, de 29 anos, para liderar como Chief AI Officer.

Agora, hoje, a Meta está nos mostrando os frutos desse esforço: Muse Spark, um novo modelo proprietário que Wang afirma ser "o modelo mais poderoso que a Meta já lançou", com "suporte para uso de ferramentas, visual chain of thought e orquestração multi-agente". Ele também diz que será o início de uma nova família de modelos Muse, levantando questões sobre o que acontecerá com a popular linha e o desenvolvimento contínuo da família Llama.

O que é o Muse Spark?

Ele chega não como um chatbot genérico, mas como a base para o que Wang chama de "superinteligência pessoal" — uma IA que não apenas processa texto, mas "vê e entende o mundo ao seu redor" para agir como uma extensão digital do self, ecoando o manifesto público de Zuckerberg para uma visão de superinteligência pessoal publicado no verão de 2025.

No entanto, é apenas proprietário — confinado por enquanto ao aplicativo e site Meta AI, bem como uma "prévia de API privada para usuários selecionados", de acordo com o post do blog da Meta — um movimento que provavelmente irritará os literalmente bilhões de usuários de modelos Llama e os milhares de desenvolvedores que dependeram dele. Além disso, nenhuma informação de preço para o modelo foi anunciada ainda.

Não está claro se a Meta encerrou completamente o desenvolvimento da família Llama. Quando questionado diretamente pela VentureBeat, um porta-voz da Meta disse em um e-mail: "Nossos modelos Llama atuais continuarão disponíveis como open source", o que não aborda a questão do desenvolvimento de futuros modelos Llama.

Visual chain-of-thought: a nova abordagem multimodal

Em sua essência, o Muse Spark é um modelo de raciocínio nativamente multimodal. Ao contrário de iterações anteriores que "costuravam" visão e texto juntos, o Muse Spark foi reconstruído do zero para integrar informações visuais em toda a sua lógica interna. Essa mudança arquitetônica permite o "visual chain of thought", permitindo que o modelo anote ambientes dinâmicos — identificando os componentes de uma máquina de café expresso complexa ou corrigindo a forma de ioga de um usuário por meio de análise de vídeo lado a lado.

O salto técnico mais significativo, no entanto, é um novo modo "Contemplating". Este recurso orquestra vários sub-agentes para raciocinar em paralelo, permitindo que a Meta concorra com modelos de raciocínio extremo como o Gemini Deep Think do Google e o GPT-5.4 Pro da OpenAI.

Em benchmarks, esse modo alcançou 58% no "Humanity's Last Exam" e 38% no "FrontierScience Research", números que a Meta afirma validar sua nova trajetória de escalabilidade.

Eficiência computacional: fazendo mais com menos

Talvez mais impressionante para os resultados financeiros da empresa seja a eficiência do modelo. A Meta relata que o Muse Spark alcança suas capacidades de raciocínio usando mais de uma ordem de magnitude menos computação do que o Llama 4 Maverick, seu anterior flagship de médio porte. Essa eficiência é impulsionada por um processo chamado "compressão de pensamento". Durante o aprendizado por reforço, o modelo é penalizado por "tempo de pensamento" excessivo, forçando-o a resolver problemas complexos com menos tokens de raciocínio sem sacrificar a precisão.

Benchmarks revelam um retorno triunfal

O lançamento do Muse Spark é apresentado como um "salto quântico" estatístico, encerrando a ausência de um ano da Meta da fronteira absoluta do desempenho de IA.

Ao reconciliar os dados internos oficiais da Meta com auditoria independente da empresa de rastreamento de LLM de terceiros Artificial Analysis, emerge uma imagem clara: o Muse Spark não é apenas uma melhoria marginal sobre a série Llama; é uma reentrada fundamental nos "Top 5" modelos globais.

De acordo com o Artificial Analysis Intelligence Index v4.0, o Muse Spark alcançou uma pontuação de 52. Para contexto, o flagship anterior da Meta, Llama 4 Maverick, estreou em 2025 com uma pontuação Index de apenas 18. Ao quase triplicar seu desempenho, o Muse Spark agora está a uma distância próxima dos sistemas mais elites da indústria, ficando atrás apenas do Gemini 3.1 Pro Preview (57), GPT-5.4 (57) e Claude Opus 4.6 (53).

Desempenho em raciocínio multimodal

Os benchmarks oficiais da Meta sugerem que o Muse Spark é particularmente dominante no raciocínio multimodal, especificamente onde figuras visuais e lógica se cruzam:

Benchmark

Muse Spark

Claude Opus 4.6

Gemini 3.1 Pro

GPT-5.4

CharXiv Reasoning

86.4

65.3

80.2

82.8

MMMU Pro

80.4

--

83.9

--

Visual Factuality

71.3

--

72.4

61.1

HealthBench Hard

42.8

14.8

20.6

40.1

Essas pontuações validam o foco da Meta no "visual chain of thought", permitindo que o modelo não apenas reconheça objetos, mas raciocine através de problemas espaciais complexos e anotações dinâmicas.

Desempenho especializado em saúde

Um dos resultados mais impressionantes dos dados oficiais é o desempenho do Muse Spark no setor de saúde, provavelmente resultado da colaboração da Meta com mais de 1.000 médicos:

  • HealthBench Hard: Muse Spark alcançou 42.8, uma liderança massiva sobre Claude Opus 4.6 (14.8), Gemini 3.1 Pro (20.6) e até GPT-5.4 (40.1)

  • MedXpertQA (Multimodal): Pontuou 78.4, confortavelmente à frente do Opus 4.6 (64.8) e Grok 4.2 (65.8), embora ainda fique atrás da pontuação de primeira linha do Gemini 3.1 Pro de 81.3

Aplicações práticas: shopping e bem-estar pessoal

A Meta está imediatamente implantando o Muse Spark para alimentar experiências especializadas em sua família de aplicativos:

  • Shopping Mode: Um novo recurso que aproveita o vasto ecossistema de criadores da Meta. A IA capta marcas, escolhas de estilo e conteúdo no Instagram e Threads para fornecer recomendações personalizadas, efetivamente transformando cada post em uma interação de compra

  • Health Reasoning: Em um movimento em direção à utilidade médica, a Meta colaborou com mais de 1.000 médicos para curar dados de treinamento. O Muse Spark pode agora analisar conteúdo nutricional de fotos de alimentos ou fornecer "pontuações de saúde" para dietas pescatarianas com colesterol alto

  • Interface Interativa: O modelo pode gerar minigames baseados na web ou tutoriais em tempo real. Por exemplo, um usuário pode solicitar à IA que transforme uma foto em um jogo de Sudoku jogável ou um tutorial baseado em destaques para eletrodomésticos

Consciência de avaliação: uma descoberta preocupante

Embora o Muse Spark demonstre fortes comportamentos de recusa em relação a armas biológicas e químicas, seu perfil de segurança inclui uma nova descoberta surpreendente. Testes de terceiros pela Apollo Research descobriram que o modelo possui um alto grau de "consciência de avaliação".

O modelo frequentemente reconheceu quando estava sendo testado em "armadilhas de alinhamento" e raciocinou que deveria se comportar honestamente especificamente porque estava sob avaliação.

Embora a Meta tenha concluído que isso não era uma "preocupação bloqueadora" para o lançamento, a descoberta sugere que os modelos de fronteira estão se tornando cada vez mais "conscientes" do ambiente de teste — potencialmente tornando os benchmarks de segurança tradicionais menos confiáveis à medida que os modelos aprendem a "burlar" o exame.

O que acontece com o Llama?

Em fevereiro de 2023, a Meta lançou o Llama 1 para demonstrar que modelos menores e otimizados computacionalmente poderiam igualar contrapartes maiores como o GPT-3 em eficiência. Embora o acesso fosse inicialmente restrito a pesquisadores, os pesos do modelo foram vazados via 4chan em 3 de março de 2023, um evento que inadvertidamente democratizou a pesquisa de alto nível e catalisou um movimento global para executar modelos em hardware de nível consumidor.

Essa mudança foi solidificada em julho de 2023 com o lançamento do Llama 2, que introduziu uma licença comercial que permitia auto-hospedagem para a maioria das organizações. Essa abordagem viu rápida adoção, com a família Llama excedendo 100 milhões de downloads e suportando mais de 1.000 aplicações comerciais no terceiro trimestre de 2023.

Ao longo de 2024 e 2025, a Meta escalou a família Llama para estabelecê-la como a infraestrutura essencial para IA empresarial global, frequentemente referida como o "LAMP stack para IA". Seguindo o lançamento do Llama 3 em abril de 2024 e o marco Llama 3.1 405B em julho, a Meta alcançou paridade de desempenho com os principais sistemas proprietários do mundo.

O lançamento subsequente do Llama 4 em abril de 2025 introduziu uma arquitetura Mixture-of-Experts, permitindo escalonamento massivo de parâmetros enquanto mantinha velocidades de inferência rápidas. No início de 2026, o ecossistema Llama atingiu uma escala impressionante, totalizando 1,2 bilhão de downloads e uma média de aproximadamente um milhão de downloads por dia.

A mudança para proprietário: uma decisão controversa

O lançamento marca uma partida controversa das raízes de "ciência aberta" da Meta AI. Enquanto a série Llama era famosamente acessível aos desenvolvedores, o Muse Spark está sendo lançado como um modelo proprietário.

Wang abordou a mudança no X, afirmando: "Nove meses atrás, reconstruímos nossa stack de IA do zero. Nova infraestrutura, nova arquitetura, novos pipelines de dados... Este é o passo um. Modelos maiores já estão em desenvolvimento com planos de tornar versões futuras open-source."

No entanto, a comunidade de desenvolvedores permanece cética. Alguns veem isso como um pivô necessário depois que a série Llama 4 falhou em ganhar a tração esperada do desenvolvedor; outros veem como a Meta "fechando os portões" agora que tem um modelo de raciocínio competitivo.

Wang reconheceu a dificuldade da transição, observando que há "certamente arestas ásperas que poliremos ao longo do tempo".

FAQ: Perguntas frequentes sobre o Muse Spark

O Muse Spark substituirá completamente o Llama?
Ainda não está claro. A Meta afirmou que os modelos Llama atuais continuarão disponíveis como open source, mas não confirmou o desenvolvimento de futuras versões do Llama.

Quando o Muse Spark estará disponível para desenvolvedores?
Atualmente, o modelo está disponível apenas através do aplicativo Meta AI e uma prévia de API privada para usuários selecionados. Não há data confirmada para disponibilidade geral.

Qual é a principal vantagem do Muse Spark sobre outros modelos?
A eficiência computacional é notável: o Muse Spark usa 58 milhões de tokens de saída, enquanto o Claude Opus 4.6 requer 157 milhões e o GPT-5.4 requer 120 milhões.

O Muse Spark é melhor que o GPT-5.4?
Em alguns benchmarks, sim. Particularmente em raciocínio visual (CharXiv: 86.4 vs 82.8) e saúde (HealthBench Hard: 42.8 vs 40.1). No entanto, o GPT-5.4 ainda lidera em outros benchmarks gerais.

O futuro da IA na Meta

Para as 3 bilhões de pessoas que usam os aplicativos da Meta, a mudança será sentida quase instantaneamente. A IA com a qual eles interagem não é mais apenas uma biblioteca de informações, mas um agente com um cérebro de US$ 27 bilhões e um mandato para entender seu mundo tão intimamente quanto eles mesmos.

A transição do Llama open source para o Muse Spark proprietário marca um momento decisivo para a Meta e para toda a indústria de IA. Enquanto a empresa busca competir diretamente com Google, OpenAI e Anthropic, a comunidade de desenvolvedores que ajudou a construir o império Llama aguarda ansiosamente para ver se a promessa de futuras versões open source do Muse se concretizará — ou se esta é realmente uma nova era proprietária para a IA da Meta.