Data Hackers Newsletter
Posts
Hermes Agent: o agente de IA open source que aprende com você

Hermes Agent: o agente de IA open source que aprende com você

Memória persistente, habilidades que evoluem e zero dependência de nuvem

Data Hackers
23 de maio de 2026

A maioria dos agentes de IA começa do zero toda vez que você abre uma nova conversa — sem memória do que foi feito antes, sem noção dos seus projetos, sem nenhuma noção do contexto. O Hermes Agent, lançado pelo Nous Research em fevereiro de 2026, propõe algo diferente: um agente autônomo open source que roda no seu servidor, guarda o que aprende em cada sessão, cria skills reutilizáveis automaticamente e te alcança pelo Telegram, Discord, WhatsApp e outros canais. Em menos de dois meses, cruzou 95 mil estrelas no GitHub — o framework de agentes de maior crescimento do ano.

O que é o Hermes Agent?

O Hermes Agent é um framework de agente de IA autônomo criado pelo Nous Research e lançado em 25 de fevereiro de 2026. Ele é open source (licença MIT), roda no seu próprio servidor e funciona com qualquer LLM que suporte contexto de 64K tokens ou mais — incluindo modelos locais via Ollama.

A diferença central em relação à maioria dos frameworks de agentes está no que o Hermes chama de "loop fechado de aprendizado": o agente não só executa tarefas, mas documenta como as resolveu, gera arquivos de skill reutilizáveis e os usa em interações futuras. Com o tempo, fica mais rápido e mais preciso nas tarefas que já viu antes.

Não é um copilot de código preso a uma IDE, nem um chatbot com memória simulada. É um processo que roda no seu servidor, conectado às suas contas de mensagens, disponível onde você estiver.

Quem está por trás: Nous Research

O Nous Research é um laboratório de IA focado em modelos open source de alta performance. O lab ficou conhecido pela família Hermes de LLMs — fine-tunes do Llama da Meta otimizados para seguir instruções, usar ferramentas e manter coerência em conversas longas.

O Hermes 4 70B, por exemplo, custa apenas $0,13 por milhão de tokens de entrada via Nous Portal — um dos modelos mais baratos para workloads de agentes no mercado. O Hermes 4.3 36B, construído sobre o modelo base Seed da ByteDance, atingiu 93,8% no MATH-500 e superou o próprio Hermes 4 70B em vários benchmarks.

O lançamento do Hermes Agent em fevereiro de 2026 foi uma expansão natural dessa trajetória: sair dos modelos e entrar no nível do agente em si — com infraestrutura, memória, aprendizado e integrações incluídas no pacote.

Como o Hermes Agent aprende — o loop fechado de autoaprendizado

Essa é a parte que diferencia o Hermes de todo o resto. O aprendizado não é marketing: é uma arquitetura concreta que roda em cinco etapas a cada tarefa relevante.

A mensagem chega por qualquer canal conectado
O agente consulta a memória persistente buscando contexto relevante (latência de ~10ms mesmo com 10 mil documentos indexados)
O LLM planeja, executa ferramentas e completa a tarefa
Se a tarefa envolveu 5 ou mais chamadas de ferramentas, o agente gera automaticamente um arquivo de skill no padrão agentskills.io
O skill é indexado na memória e fica disponível para sessões futuras

Nos benchmarks publicados pelo Nous Research, agentes com 20 ou mais skills auto-geradas completam tarefas de pesquisa similares 40% mais rápido do que instâncias sem histórico. Não é 40% de melhoria na qualidade da resposta — é 40% menos tokens e tempo para chegar ao mesmo resultado.

Um ponto importante: a melhora é específica por domínio. Um skill aprendido em tarefas de pesquisa de mercado não transfere automaticamente para revisão de código. O agente fica muito bom no que você usa com frequência, não de forma genérica.

Memória persistente em três camadas

O sistema de memória do Hermes tem três níveis distintos:

Memória de sessão — o contexto da conversa atual, padrão para qualquer LLM.

Memória persistente — armazenada em SQLite com indexação FTS5. Guarda outcomes de tarefas, skills gerados e notas salvas pelo usuário. Escala bem até ~100 mil documentos sem precisar de infraestrutura adicional.

Modelo do usuário — um perfil de preferências construído automaticamente ao longo das sessões. O agente aprende seu estilo de comunicação, ferramentas favoritas, horário de trabalho, colaboradores frequentes. Tudo sem nenhuma configuração manual.

O trade-off dessa abordagem: a memória é automática, mas pouco transparente. Você não tem acesso fácil a uma lista de "tudo que o agente sabe sobre mim". Frameworks como o OpenClaw usam memória baseada em arquivos — mais auditável, porém mais trabalhosa de manter.

Criação automática de skills

Cada skill gerado pelo Hermes segue o padrão aberto agentskills.io — o mesmo formato usado pelo sistema de skills do Claude Code e compatível com outros agentes que adotam o padrão. É um diretório com um arquivo SKILL.md em Markdown, com frontmatter YAML e suporte a scripts, referências e assets.

O Hermes já vem com 118 skills pré-instalados (96 obrigatórios + 22 opcionais) em mais de 26 categorias — MLOps, GitHub, diagramas, pesquisa web, entre outros. Os skills da comunidade passam por um scanner de segurança que verifica exfiltração de dados, injeção de prompt e comandos destrutivos antes de serem publicados.

O Hermes Agent realmente funciona com modelos locais?

Sim, e bem. O Hermes é agnóstico de modelo — funciona com qualquer endpoint compatível com a API da OpenAI. Para rodar totalmente local, basta configurar o Ollama como backend.

Com Ollama, toda a inferência, memória, execução de ferramentas e uso de skills acontece na sua máquina, sem nenhuma chamada de API externa. Zero custo de tokens, zero dependência de internet.

Para quem tem GPU com 8–12 GB de VRAM, os modelos Hermes 3 8B e Qwen 2.5 Coder 7B são boas opções. Com 24 GB de VRAM, o Qwen 2.5 Coder 32B oferece raciocínio notavelmente melhor para tarefas complexas.

É o cenário ideal para quem tem requisitos de privacidade, trabalha em ambientes air-gapped ou simplesmente não quer depender de chaves de API para o dia a dia.

Um agente que funciona em múltiplos canais: Telegram, Discord e muito mais

Um dos recursos mais práticos do Hermes é o gateway unificado: um único processo que conecta Telegram, Discord, Slack, WhatsApp, Signal e CLI ao mesmo agente, com o mesmo histórico e a mesma memória.

Você começa uma pesquisa pelo terminal no trabalho, continua pelo Telegram no celular e o agente mantém o contexto completo dos dois lados. A versão 0.8.0 adicionou suporte Tier 1 ao Matrix, com reactions, read receipts e controles de canal no Discord.

O gateway também suporta transcrição de mensagens de voz — útil para quem prefere falar ao invés de digitar em dispositivos móveis.

A limitação aqui é real: são 6 plataformas mais Matrix, contra mais de 24 no OpenClaw. Se você precisa de integração com LINE, WeChat, Teams ou iMessage, o Hermes ainda não cobre.

Quais ferramentas o Hermes Agent tem por padrão

O Hermes vem com mais de 40 ferramentas nativas, organizadas em categorias:

Web e pesquisa — busca na internet, extração de páginas via Firecrawl
Browser — automação completa com Chromium (navegação, clique, screenshot)
Terminal — execução de comandos shell com captura de output
Arquivos — leitura, escrita, busca e edição de arquivos locais
Visão e imagens — análise visual e geração de imagens via FAL
Código — execução sandboxada de código
Cron — agendamento de tarefas recorrentes
Delegação — criação de sub-agentes paralelos para pipelines complexos
Home Assistant — controle de automação residencial e IoT
Memória — busca em sessões anteriores

Além das ferramentas nativas, o Hermes suporta o Model Context Protocol (MCP), alguns ajustes no arquivo de configuração conectam servidores externos como GitHub, bancos de dados e APIs internas sem modificar o core do agente.

Como instalar o Hermes Agent

💡 DICA: Se preferir ver na prática antes de colocar a mão na massa, a Karine Lago gravou um passo a passo completo de configuração do Hermes Agent — do zero até o agente rodando no Telegram, com exemplos reais de automação de notícias, integração com Notion e monitoramento de passagens aéreas. Vale os 23 minutos: Novo Hermes Agent: Tenha seu próprio agente em 23 minutos

Karine Lago

O Hermes roda em Linux, macOS e WSL2. Windows nativo ainda é experimental — a recomendação oficial é usar WSL2.

A instalação mais rápida é via script de uma linha:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

O script detecta a plataforma, instala Python 3.11, clona o repositório e configura os diretórios. Depois disso:

# Assistente de configuração interativo
hermes setup

# Escolha o modelo LLM
hermes model

# Inicie o agente
hermes

Para quem prefere Docker (recomendado em servidores pela hardening de segurança):

mkdir -p ~/.hermes
docker run -it --shm-size=1g \
  -v ~/.hermes:/root/.hermes \
  nousresearch/hermes-agent:latest

O --shm-size=1g é necessário porque o Playwright (usado para automação de browser) precisa de memória compartilhada.

Para deixar o agente sempre disponível em um VPS de $5/mês:

hermes daemon install --platform telegram --bot-token SEU_TOKEN
hermes daemon start
systemctl enable hermes

Um ponto que pega muita gente: o aprendizado persistente vem desativado por padrão. Para ativar:

hermes config set memory.persistent true
hermes config set skills.autogen true

Sem isso, o Hermes se comporta como um agente comum de sessão única, e o diferencial de autoaprendizado não aparece.

O framework é gratuito — licença MIT, sem limites de uso, sem tier pago. Os custos vêm de duas fontes: hospedagem e chamadas de API de LLM.

Hospedagem:

Opção	Custo mensal
Máquina local	$0
VPS básico (2 cores, 8 GB)	$5–10
VPS intermediário (4 cores, 16 GB)	$15–30
Serverless (Modal)	$0–5

API de LLM (custo por tarefa complexa com modelos econômicos): ~$0,30

Modelo	Entrada (por MTok)	Saída (por MTok)
Hermes 4 70B (Nous Portal)	$0,13	$0,40
Claude Sonnet 4.6	$3,00	$15,00
GPT-4o	$2,50	$10,00
Ollama (local)	$0	$0

Vale saber: cerca de 73% de cada chamada de API é overhead fixo — só as definições de ferramentas consomem quase metade dos tokens. Isso torna tarefas curtas relativamente mais caras do que tarefas longas. Para otimizar, roteie tarefas simples para modelos baratos e reserve os modelos mais caros para raciocínio complexo.

Custo mensal estimado por perfil de uso:

Hobbysta (local + Ollama): $0
Uso leve (VPS + Hermes 4 70B): $20–50
Uso intenso (VPS + modelos frontier): $50–150

Hermes Agent ou OpenClaw: qual escolher?

O OpenClaw é o framework de agentes mais popular do mercado, com mais de 345 mil estrelas no GitHub. A comparação é inevitável.

	Hermes Agent	OpenClaw
Filosofia	Agente como mente que evolui	Agente como sistema a orquestrar
Autoaprendizado	Loop fechado nativo	Sem aprendizado nativo
Skills	118 curados + auto-geração ilimitada	13.000+ na comunidade
Plataformas	6 + Matrix	24+
CVEs (2026)	Zero	9 em 4 dias (incluindo CVSS 9.9)
Memória	Automática, três camadas	Baseada em arquivos, manual
Setup	Moderado	Simples
Licença	MIT	MIT

Escolha o Hermes se você quer um agente que melhore com o uso, valoriza segurança (zero CVEs) e vai usar o mesmo agente por 6 meses ou mais. O diferencial de aprendizado composto com o tempo é real.

Escolha o OpenClaw se precisa de cobertura ampla de plataformas (24+), quer acesso a um ecossistema de skills já maduro ou precisa de algo mais simples de configurar. O histórico de CVEs do OpenClaw em março de 2026 — incluindo instâncias expostas publicamente — é um ponto de atenção sério, mas o ecossistema ainda é muito maior.

O que ainda falta — limitações honestas

O Hermes tem dois meses de vida. Vale saber o que ainda está imaturo antes de apostar nele.

O aprendizado vem desligado. Já mencionamos, mas merece reforço: o recurso principal do framework não está ativo por padrão. Muitos usuários reclamam que a promessa não se materializa — e o motivo é esse.

A melhoria é específica por domínio. Skills de pesquisa não viram skills de programação. O ganho de 40% acontece dentro do mesmo tipo de tarefa, não de forma transversal.

Instabilidade entre versões. O Hermes foi do v0.1.0 ao v0.10.0 em dois meses. A API não tem estabilidade garantida entre versões menores. Em ambientes de produção, vale fixar a versão e monitorar as notas de release.

Memória opaca. Não dá para exportar facilmente "tudo que o agente sabe sobre mim" em formato legível. Isso pode ser um problema para conformidade com LGPD ou para quem quer auditar os próprios dados.

Não é uma ferramenta de geração de código. Para engenharia de software, ferramentas como Cursor, Windsurf ou Claude Code entregam resultados melhores. O Hermes é um agente de tarefa e automação, não um coding assistant.

Menos plataformas. 6 contra 24+ do OpenClaw. Se seu fluxo depende de LINE, Teams ou WeChat, o Hermes ainda não cobre.

Vale a pena usar o Hermes Agent hoje?

Para quem vai usar o mesmo agente todos os dias por meses seguidos — sim, claramente. O modelo de aprendizado composto cria um diferencial real que frameworks estáticos não conseguem replicar. Rodar com Ollama localmente zera o custo de API. A licença MIT garante que você controla tudo.

Para quem precisa de cobertura ampla de plataformas, de um ecossistema de skills já estabelecido ou de algo mais simples de colocar em produção hoje — o OpenClaw ainda tem vantagem, apesar dos problemas de segurança recentes.

A pergunta certa não é "qual é o melhor framework de agentes". É: você vai usar isso por tempo suficiente para o aprendizado composto fazer diferença? Se a resposta for sim, o Hermes Agent merece uma chance real.

GitHub: github.com/nousresearch/hermes-agent

Documentação: hermes-agent.nousresearch.com/docs

Gostou desse tipo de conteúdo? A newsletter semanal do Data Hackers traz toda semana os principais movimentos em IA, dados e tecnologia com a curadoria de quem vive o mercado.

Assine grátis em https://www.datahackers.news e fique por dentro!