Desenvolvedor Lume/Agentes (n8n + Python + LLM)
ESTECH ESCO & ENGENHARIA LTDAVinhedo - SP
1 posição
Não informado
Integral
Venha transformar dados em economia para o varejo!
No NEO Estech, somos movidos por dados e inovação. Iniciamos nossa jornada com projetos de eficiência energética e, ao longo dos anos, evoluímos até nos tornarmos referência em inteligência de dados para refrigeração e energia no varejo.
Hoje, com mais de 200 mil sensores ativos, entregamos resultados reais e mensuráveis para líderes de mercado. Nosso propósito? Transformar operações com inteligência de dados, promovendo eficiência, economia e sustentabilidade.
Estamos em busca de um(a) Desenvolvedor Lume/Agentes (n8n + Python + LLM) para integrar nossa equipe da Digital Tech.
Responsabilidades principais- Orquestração de agentes com n8n + nodes LangChain + integrações externas.
- Criação e manutenção de ~20 tools customizadas que consultam APIs do NEO e executam ações.
- Configuração de múltiplos LLMs com validação robusta e fallback entre providers.
- Gestão de memória de conversação (PostgreSQL) e cache de sessão (Redis).
- Construção e atualização de knowledge bases (RAG) por contexto de atendimento.
- Implementação de logs/audit trail para cada decisão do agente (Supabase).
- Melhoria contínua: analisar falhas, ajustar prompts, otimizar tool calls, criar fallbacks.
- Documentação dos fluxos, padrões e limitações.
- Construir e manter fluxos de agentes no n8n para o Lume (assistente IA da Estech).
- Integrar múltiplos LLMs (Gemini, OpenAI, DeepSeek, Grok) com regras de negócio e validação.
- Criar e manter tools customizadas que consultam APIs do NEO (ex: get_energia, get_chamados, get_coolsense, get_conectividade, cadastrar_usuario, report_clickup).
- Implementar roteamento inteligente: direcionar conversas para agentes específicos por contexto (Jornada NEO, Mecalor, Digital Tech).
- Manter knowledge bases (RAG) atualizadas para cada contexto de atendimento.
- Integrar com Chatwoot (atendimento via WhatsApp e web chat) via webhooks.
- Debug de falhas: input ruim, contexto insuficiente, tool call falhando, alucinação, memória inconsistente.
- Documentar fluxos de forma curta e útil (o que entra, o que sai, quando escala para humano).
- n8n — obrigatório. Usamos em produção para orquestração dos agentes.
- Python — forte. Essencial para refatoração futura de agentes n8n → Python puro.
- Integração com APIs de LLM — saber consumir múltiplos providers (OpenAI, Gemini, DeepSeek, Grok), configurar prompts, lidar com tokens e rate limits.
- Orquestração de agentes — entender o ciclo: input → validação → decisão do LLM → tool call → output.
- Tool calling — criar e manter tools customizadas que consultam APIs e executam ações (ex: buscar dados de equipamentos, criar chamados, consultar métricas).
- Prompt engineering aplicado — não "prompt influencer", mas prompts que funcionam em produção com validação e fallback.
- Webhooks e integrações REST — receber, processar e responder chamadas HTTP.
- Lógica de roteamento por contexto — direcionar conversas para agentes diferentes baseado no perfil do usuário (ex: cliente varejo vs. cliente industrial vs. usuário interno).
- Memória de conversação — persistir contexto entre mensagens usando banco de dados (PostgreSQL, Redis).
- Logs e rastreabilidade — audit trail de cada decisão do agente (input → decisão → saída).
- n8n — usamos em produção para orquestração de agentes (nodes de LangChain integrados).
- RAG (Retrieval-Augmented Generation) — construir e manter knowledge bases por contexto, embeddings (Mistral, OpenAI).
- Multimodal (imagem/áudio) — integração de STT/TTS, streaming e upload de imagem.
- MCP (Model Context Protocol) — padronizar tools e integrações externas.
- LLM as Judge — avaliação automática de respostas e critérios de qualidade.
- Observabilidade de uso e custo — dashboards, métricas e alertas de consumo.
- Chatwoot — plataforma de atendimento que integra com os agentes via webhook.
- Laravel/PHP — para integrar com o backend existente.
- MySQL/PostgreSQL/Redis — queries, cache de sessão, memória de conversas.
- Supabase — usado para armazenar dados de conversas e execuções.
- Conceitos de agentes autônomos — LangChain, CrewAI, ou similares.
- LLMs: OpenAI (GPT), Google Gemini, DeepSeek, xAI Grok, Mistral (embeddings)
- Multimodal: STT/TTS (Whisper, Google Speech, ElevenLabs), upload de imagem, OCR
- Protocolos: MCP (Model Context Protocol)
- Orquestração: n8n com nodes LangChain (agents, tools, memory)
- Atendimento: Chatwoot (WhatsApp, web chat)
- Produto: NEO/Maestro (APIs de dados operacionais)
- Gestão: ClickUp (tasks, reports)
- Código: Git/GitHub, GitHub Copilot
- Dados: PostgreSQL (memória de conversas), Redis (cache), MySQL, Supabase, InfluxDB
- Observabilidade: Grafana
- Acesso: SSH/VPN
- Comunicação: Email/Office
- Escolaridade: Superior completo ou incompleto (cursando) — obrigatório.
- Ciência da Computação
Engenharia de Computação
Sistemas de Informação
Análise e Desenvolvimento de Sistemas
Engenharia de Software
Local de trabalho: Vinhedo
Modalidade de trabalho: Híbrido
Modalidade de Contrato: PJ
Requisitos
Escolaridade
- Graduação
- Tecnólogo