¿Qué es Hermes Agent?

Hermes Agent es un agente de IA autónomo y de código abierto creado por Nous Research, publicado en febrero de 2026 bajo la licencia MIT. A diferencia de los copilotos de código que viven dentro de un IDE o de los chatbots que envuelven una sola API, Hermes es un agente que se mejora a sí mismo, que se ejecuta en tu propia infraestructura, persiste la memoria entre sesiones y acumula capacidades cuanto más tiempo lleva funcionando. Alcanzó 135.000 estrellas en GitHub en menos de tres meses, convirtiéndose en uno de los frameworks de agentes de código abierto de crecimiento más rápido del año.

El agente funciona en Linux, macOS y WSL2 sin requisitos previos: el instalador gestiona todo a través de un único comando curl desde el terminal. La interfaz es de tipo TUI (interfaz de usuario de terminal), lo que significa que opera completamente desde la línea de comandos. Una vez en marcha, Hermes se conecta al proveedor de modelos de IA que selecciones y toda tu historial de conversaciones y tareas se almacena localmente.

La función que diferencia a Hermes de los agentes más simples es /goal. Darle a Hermes un objetivo en lugar de una tarea puntual le indica que trabaje de forma autónoma hasta alcanzarlo — encadenando llamadas a herramientas, verificando su propio resultado y continuando sin necesidad de intervención. Este bucle puede ejecutarse durante horas y realizar miles de llamadas a herramientas, lo que lo hace especialmente adecuado para investigación, generación de código y tareas de archivos de múltiples pasos que normalmente requerirían estar frente al teclado.

¿Qué es MiniMax M3?

MiniMax M3, lanzado el 1 de junio de 2026, es un modelo de frontera de pesos abiertos construido sobre una arquitectura propia denominada MiniMax Sparse Attention (MSA). La idea central de MSA es sencilla: en lugar de atender a cada token de la ventana de contexto, el modelo selecciona los bloques más relevantes de su caché de clave-valor para cada consulta y omite el resto. Esto significa que un contexto de 1 millón de tokens no cuesta el equivalente computacional de 1 millón de tokens, sino aproximadamente una vigésima parte, porque la mayor parte del contexto se omite la mayor parte del tiempo.

En la práctica, esto produce dos efectos. En primer lugar, el modelo es rápido: MiniMax reporta más de 9× de aceleración en la fase de precarga y más de 15× en la decodificación con contextos largos, en comparación con un modelo de atención estándar. En segundo lugar, el contexto de 1 millón de tokens —suficiente para contener una base de código completa o un informe de investigación de la extensión de un libro— está disponible a un precio que sería antieconómico con una atención convencional.

En los benchmarks publicados por MiniMax, M3 obtiene un 59,0% en SWE-Bench Pro y un 83,5% en BrowseComp, superando a GPT-5.5 y Gemini 3.1 Pro en tareas de programación y por encima de Claude Opus 4.7 en generación de SVG y benchmarks de navegación. Estas cifras provienen de los propios resultados publicados por MiniMax; la verificación independiente de terceros aún está alcanzando a un modelo lanzado hace pocas semanas.

Nota sobre cobertura patrocinada. MiniMax M3 ha aparecido en varias demostraciones en YouTube patrocinadas por MiniMax. Los datos técnicos sobre el modelo son verificables de forma independiente a partir del blog de investigación de MiniMax y de agregadores de benchmarks de terceros. Los precios y planes de suscripción indicados en este artículo se basan en esas fuentes primarias.

Instalación de Hermes y conexión a MiniMax

La instalación completa requiere un solo comando en el terminal. Abre un terminal (o WSL2 en Windows) y ejecuta el instalador de una línea del repositorio de GitHub de Hermes:

curl -fsSL https://hermes-agent.org/install.sh | sh

El instalador descarga Hermes y sus dependencias automáticamente. Una vez completado, inicia Hermes desde el terminal. La configuración del primer inicio te pedirá que selecciones un proveedor de modelos — elige MiniMax de la lista.

Para obtener tu clave API de MiniMax, visita minimax.io, crea una cuenta y navega hasta la consola de API. Copia la clave y pégala cuando Hermes te la pida. Luego selecciona MiniMax M3 como modelo. A partir de ese momento, Hermes utiliza M3 como su inteligencia subyacente para todas las tareas.

Primera tarea. Prueba un /goal sencillo para verificar la configuración: escribe /goal Write a summary of the last 5 files in this directory and save it as summary.md. Hermes debería listar los archivos, leerlos, escribir el resumen y confirmarlo, todo sin más instrucciones.

Qué puedes hacer realmente

Con un contexto de 1 millón de tokens y un bucle de objetivos autónomo, la combinación abre tareas que son poco prácticas con ventanas de contexto más pequeñas o modelos que requieren supervisión constante.

Investigación en profundidad. Usa /goal para pedirle a Hermes que investigue un tema, recopile fuentes y produzca un informe estructurado. El contexto de 1 millón de tokens permite al agente mantener en memoria todo su conjunto de trabajo — notas, fuentes, borradores — sin perder el material anterior. Este tipo de tarea antes requería herramientas de investigación de pago o pipelines de agentes a medida.

Trabajo a escala de base de código. Hermes puede leer un proyecto completo, comprender dependencias entre archivos, implementar una función, escribir pruebas e iterar, todo como un único objetivo. Con un contexto lo suficientemente grande, el agente no necesita paginar a través del código ni perder el rastro de hallazgos anteriores.

Generación creativa. Animaciones SVG, maquetas de diseño y trabajo creativo multi-archivo son tareas en las que el rendimiento de MiniMax M3 en los benchmarks de SVG se manifiesta en la práctica. Estas tareas se completan rápidamente y a un coste muy bajo por ejecución.

Automatización de múltiples pasos. Dado que Hermes persiste la memoria entre sesiones y admite integraciones multi-canal (Telegram, Discord, Slack y otros), puede dejarse monitoreando una tarea e informar de vuelta — en lugar de requerir supervisión en cada paso.

¿Cuánto cuesta realmente?

MiniMax M3 tiene un precio de 0,60 $ por millón de tokens de entrada y 2,40 $ por millón de tokens de salida en el nivel de API estándar, tal como figura en OpenRouter y en la consola de API de MiniMax. En el lanzamiento, MiniMax ofreció un descuento promocional del 50%, llevando los precios efectivos a aproximadamente 0,30 $ de entrada y 1,20 $ de salida por millón de tokens, aunque las tarifas promocionales cambian y conviene verificar los precios actuales antes de presupuestar un proyecto.

NivelEntrada (por 1M tokens)Salida (por 1M tokens)Límite de contexto
API estándar0,60 $2,40 $1M tokens
Descuento de lanzamiento (50%)~0,30 $~1,20 $1M tokens
Nivel de contexto largo (>512K tokens)1,20 $4,80 $1M tokens

Para contextualizar los precios estándar: una tarea de investigación que lea 50.000 tokens de material fuente y genere un informe de 5.000 tokens costaría aproximadamente 0,04 $ a tarifas estándar. Una sesión autónoma más larga trabajando con una base de código mediana — por ejemplo, 200.000 tokens de entrada y 20.000 de salida — costaría alrededor de 0,17 $. Estas cifras son orientativas; los costes reales dependen en gran medida de la duración del bucle de objetivos y de cuánto genera el modelo.

El propio Hermes no tiene coste por consulta: es de código abierto y se ejecuta localmente. El único coste es el uso de la API del modelo que conectes.

Open Code: una conexión adicional

Si ya utilizas una herramienta de programación en la línea de comandos, vale la pena saber que Open Code — una alternativa de código abierto a los agentes de programación comerciales — también admite MiniMax M3 como backend. La conexión se realiza con un único comando dentro de Open Code:

/connect minimax

Esto te proporciona un flujo de trabajo similar al de los agentes de programación propietarios, impulsado por el mismo modelo M3 y a las mismas tarifas de API. Si prefieres el bucle autónomo basado en objetivos de Hermes o el enfoque centrado en la edición de archivos de Open Code depende de la tarea; ambos son compatibles con la misma clave API de MiniMax.