O ecossistema do GitHub para desenvolvimento com Inteligência Artificial nunca avançou tão rapidamente. Toda semana surgem novos repositórios que mudam genuinamente como você constrói — pipelines de contexto, ferramentas de busca, interfaces locais, esqueletos de agentes. A maioria dos desenvolvedores continua usando as mesmas três ou quatro ferramentas que já conhece. É compreensível, mas fácil de resolver.
Esses oito projetos são gratuitos, de código aberto e instaláveis em uma tarde. Os primeiros quatro vieram de um desenvolvedor que os usa diariamente. Os quatro finais são amplamente adotados e intensamente utilizados por equipes que trabalham com modelos locais, fluxos multi-agente e pipelines de tokens agora.
Last30Days — busca votada por pessoas para o seu stack de agentes
A maioria das buscas integradas com IA mostra o que os algoritmos consideram popular — o que frequentemente significa conteúdo otimizado para SEO, não respostas úteis. Last30Days adota uma abordagem diferente. Em vez de rastrear toda a web, extrai do Reddit, Hacker News, Polymarket, GitHub, X, YouTube e TikTok, pontuando resultados por votos positivos, curtidas e engajamento, e não por autoridade de link ou gasto com anúncios.
O resultado se aproxima mais de "o que pessoas inteligentes estão discutindo agora" do que uma página de resultados de busca tradicional. Instale-o como uma skill no Claude Code, Cursor, Codex ou qualquer plataforma agêntica que suporte arquivos de skills, e chame-o com /last30days seguido da sua consulta. O relatório retorna estruturado com fontes e contagens de votos. Há também uma flag --emit=html que gera uma página de resumo compartilhável.
O motor V3 faz algo notável: antes de buscar, resolve o tema para as fontes mais relevantes. Digite o nome de um projeto e ele encontra automaticamente as contas e subreddits associados, para que o relatório venha da comunidade real que discute o tema. O repositório tem cerca de 40.000 estrelas e foi criado por Matt Van Horn, cofundador da startup que se tornou a Lyft.
Open Notebook — inteligência documental local com geração de podcasts
O NotebookLM do Google estabeleceu a demanda por uma ferramenta que transforma documentos em uma interface de pesquisa interativa: carregue conteúdo, faça perguntas, gere uma discussão de áudio sintetizada. O Open Notebook é um equivalente de código aberto que roda na sua própria infraestrutura, sem que nenhum dado saia do seu ambiente.
Você pode conectá-lo a modelos hospedados — GPT-5.5 para chat, text-embedding-3-large para recuperação, GPT-4o para síntese — ou executá-lo completamente offline via Ollama ou LM Studio. Carregue uma URL ou um arquivo e a interface mostra uma visão de leitura limpa com insights extraídos ao lado. Pergunte qualquer coisa sobre o documento e ele cita a passagem de onde extraiu a informação.
A geração de podcasts é o recurso de destaque. Configure conversas com vários apresentadores de tons diferentes, edite a transcrição antes da síntese e produza um resumo de áudio de 20 a 30 minutos que soa como uma discussão real. Cerca de 30.000 estrelas e crescendo constantemente.
Agent Skills — fluxo de trabalho de engenharia estruturado em sete comandos
Há um padrão na engenharia agêntica eficaz que desenvolvedores experientes descobriram: escreva as especificações primeiro, planeje antes de construir, revise antes de publicar. A maioria das pessoas pula direto para "construa este recurso" e se pergunta por que o resultado não se encaixa na base de código. O Agent Skills codifica esse fluxo de trabalho em comandos slash.
Instale-o e você obtém: /spec, /plan, /build, /test, /review, /simplify e /ship. Comece com /interviewme, que abre uma conversa estruturada para extrair exatamente o que você está tentando construir. Ele faz perguntas de esclarecimento, identifica casos extremos e produz um arquivo de especificação em markdown que você usa como âncora para o restante do fluxo de trabalho.
É comparável em espírito a playbooks de engenharia estruturada, mas o Agent Skills permanece focado apenas no ciclo de engenharia. Esse escopo mais estreito o torna mais rápido de adotar e mais fácil de personalizar. Atualmente o mais popular dos quatro repositórios, com mais de 56.000 estrelas.
Headroom — compressão de contexto que reduz o uso de tokens em até 92%
As janelas de contexto em 2026 são grandes — um milhão de tokens é padrão nos modelos frontier. O problema é preenchê-las. Saídas de ferramentas, documentos recuperados, arquivos de log e histórico de conversa empurram uma única sessão muito além do que é prático executar repetidamente. O Headroom comprime tudo isso antes de chegar ao LLM sem degradar a qualidade das respostas.
A compressão é transparente. Envolva sua ferramenta existente — headroom wrap claude funciona igual ao Claude Code, apenas com entradas menores. Economias em cargas de trabalho reais: busca de código com 100 resultados de 17.000 tokens para 1.400 (redução de 92%). Depuração de incidentes de 65.000 para 5.000. Exploração de base de código de 78.000 para 41.000. O comando headroom learn analisa sessões com falha e escreve melhorias sugeridas no seu arquivo CLAUDE.md ou agents.md.
Duas notas de instalação: por padrão, o Headroom instala uma ferramenta chamada Serena que não tem relação com compressão de contexto. Passe --no-sa durante a instalação para ignorá-la. A telemetria também está ativada por padrão — desative-a na configuração. Cerca de 24.000 estrelas e subindo rapidamente.
Open WebUI — a interface padrão auto-hospedada para modelos locais
Se você executa modelos via Ollama, o Open WebUI é a resposta padrão para uma interface utilizável. Ele envolve seu provedor de modelos local com uma aplicação web completa: histórico de conversas, troca de modelos, upload de documentos com geração aumentada por recuperação, geração de imagens, entrada de voz, suporte multiusuário e chamadas a ferramentas MCP adicionadas no início de 2026.
A configuração via Docker é o caminho mais rápido — um único docker run com a URL do seu host Ollama e você está em funcionamento em menos de um minuto. Também se conecta a endpoints compatíveis com OpenAI, então você pode apontá-lo para modelos locais e hospedados simultaneamente e alternar entre eles em uma única interface. Com mais de 65.000 estrelas, é uma das interfaces de IA de código aberto mais implantadas de 2025-26.
Browser Use — dê aos seus agentes de IA um navegador web real
A maioria dos frameworks de agentes dá aos modelos acesso a texto — documentos recuperados, respostas de API, resultados de busca. O Browser Use lhes dá um navegador. A biblioteca Python envolve o Playwright para que seu agente possa navegar para qualquer URL, clicar em elementos, preencher formulários, extrair conteúdo estruturado e capturar regiões específicas da tela — tudo via código.
Os usos práticos vão além do que parecem à primeira vista. Pesquisa competitiva, automação de formulários, monitoramento de páginas para detectar mudanças, acesso a conteúdo atrás de logins ou em páginas renderizadas dinamicamente que bloqueiam scraping. O agente vê o DOM como uma árvore de acessibilidade estruturada em vez de HTML bruto, o que significa que pode raciocinar sobre uma página de forma significativa. Cerca de 45.000 estrelas.
LiteLLM — uma API para mais de 100 provedores de LLM
Todo projeto de IA eventualmente esbarra na mesma limitação: você constrói contra o SDK de um provedor e depois precisa mudar — porque o modelo ficou caro demais, um concorrente lançou algo melhor ou você precisa de modelos diferentes para tarefas diferentes. O LiteLLM fornece uma única interface compatível com OpenAI que faz proxy para mais de 100 provedores: Anthropic, Google, Cohere, Azure, Bedrock, Vertex, modelos Ollama locais e muitos mais.
Você escreve o código uma vez no formato OpenAI. O LiteLLM cuida da tradução. Troque de provedor atualizando uma linha de configuração. Você também pode executá-lo como um servidor proxy independente. Além do roteamento, ele adiciona balanceamento de carga, rastreamento de custos por modelo, fallbacks de limite de taxa e registro de solicitações. Para equipes com cargas de trabalho variáveis, rotear tarefas caras para modelos mais econômicos sem tocar no código da aplicação é um ganho operacional real.
smolagents — agentes mínimos nativos em código pelo Hugging Face
A maioria dos frameworks de agentes pede que você defina ferramentas como esquemas JSON estruturados, configure templates de prompts e gerencie o estado explicitamente. O smolagents adota uma abordagem diferente: os agentes escrevem e executam código Python para realizar tarefas em vez de fazer uma sequência de chamadas de API. O modelo decide o que fazer, escreve um trecho curto de Python, executa-o, observa a saída e continua. Esse é o padrão de agente de código.
A vantagem prática é o acesso a qualquer biblioteca Python como ferramenta sem precisar registrá-la previamente. Também tende a produzir um raciocínio de múltiplas etapas mais confiável porque o agente está construindo um pequeno programa — não uma cadeia de chamadas JSON.
O smolagents é intencionalmente mínimo. A biblioteca principal tem menos de 3.000 linhas de Python — legível em uma tarde, o que importa quando você está depurando um agente em produção e precisa entender exatamente onde algo deu errado. Se os frameworks existentes parecem opacos demais, esta é a alternativa mais limpa.
Como escolher qual instalar
Essas oito ferramentas abordam limitações diferentes. Você não precisa de todas — comece com a que resolve o problema mais imediato no seu fluxo de trabalho atual:
| Problema | Repositório a testar |
|---|---|
| Atingindo cotas de API ou ficando sem contexto | Headroom |
| Preciso de informações atuais no meu agente | Last30Days |
| Trabalhando com documentos ou artigos de pesquisa | Open Notebook |
| Muita iteração antes de a construção acertar | Agent Skills |
| Executando modelos locais e precisando de interface | Open WebUI |
| Fluxo de trabalho do agente requer um navegador real | Browser Use |
| Chamando múltiplos provedores de LLM | LiteLLM |
| Framework de agentes existente parece uma caixa preta | smolagents |
Nenhum deles requer um compromisso de infraestrutura significativo para avaliar. Os baseados em skills (Last30Days, Agent Skills) levam alguns minutos. Os baseados em servidor (Open WebUI, LiteLLM) precisam de um comando Docker. As bibliotecas (Browser Use, smolagents, Headroom) seguem instalações padrão via pip.
Perguntas frequentes
Preciso instalar todos os oito?
Não. Cada um resolve um problema específico. Comece com o que aborda sua limitação mais imediata e adicione outros conforme seu fluxo de trabalho crescer.
Eles funcionam com Claude Code, Cursor e Codex?
A maioria sim. O Headroom envolve explicitamente Claude Code, Cursor e Codex. Last30Days e Agent Skills se instalam como skills. Open WebUI, Browser Use, LiteLLM e smolagents são bibliotecas ou servidores independentes que se integram via API.
Algum é adequado para produção?
Open WebUI e LiteLLM estão em uso de produção em escala. Browser Use está pronto para tarefas de navegador bem definidas. Last30Days, Agent Skills e Open Notebook são mais adequados para desenvolvimento e fluxos pessoais. Headroom e smolagents são capazes para produção, mas se beneficiam de testes prévios.
Qual é melhor para reduzir custos de IA?
Headroom e LiteLLM abordam isso de ângulos diferentes. O Headroom comprime o que você envia para qualquer LLM — reduzindo o uso de tokens em 47–92% dependendo da tarefa. O LiteLLM permite rotear para modelos mais baratos sem alterar o código. Usar ambos juntos oferece a maior flexibilidade.