Especialista Observability

2 semanas atrás


Barueri, São Paulo, Brasil SysMap Tempo inteiro R$90.000 - R$120.000 por ano

Descrição da vaga:

Principais responsabilidades

Estratégia & Governança

Desenhar e gerir a estratégia de APM (padrões de instrumentação, naming, amostragem, retenção, privacidade).

Atuar como especialista de referência e consultor interno : evangelização, treinamento e melhores práticas.

Configuração & Administração de Plataforma (Dynatrace/DataDog)

Configurar e otimizar a coleta e o desempenho da plataforma; gestão de agentes , políticas, sampling/profiling.

Otimização de recursos e custos : licenças/consumo, data retention , quotas e performance da ferramenta.

Instrumentação & Telemetria

Instrumentar apps com OpenTelemetry (SDKs/auto-instrumentation/Collector) e/ou agentes nativos.

Coletar/enriquecer métricas, logs, traces ; mapear dependências e serviços.

Análise de Performance & RCA

Deep-dive de performance (latência, throughput, error rate, disponibilidade).

Distributed tracing , dependency mapping e root cause analysis em ambientes complexos.

Dashboards, Notebooks, Workflows & Alertas

Construir dashboards na própria ferramenta de APM (Dynatrace/DataDog/Elastic APM/Kibana) com detecção de anomalias e KPIs técnicos/de negócio.

Desenvolver notebooks para investigações guiadas e storytelling técnico.

Criar/orquestrar workflows nativos (automação de resposta, enriquecimento, abertura/atualização de tickets).

Projetar alertas acionáveis (limiares dinâmicos, correlação) e reduzir falsos positivos .

Integrações, Automação & CMDB

Integrar o APM com CMDB/ITSM (ServiceNow) e ferramentas de Observabilidade como Zabbix e Elastic , CI/CD , webhooks e conectores nativos/APIs .

Automatizar provisionamento de monitores, auto-tagging , enriquecimento de eventos e integrações AzureDevops/CI-CD.

Liderança & Comunicação

Traduzir insights técnicos para públicos não técnicos e executivos.

Requerimentos:

Requisitos (obrigatórios)

Domínio de plataforma APM (Dynatrace e/ou DataDog) : funcionalidades principais e recursos avançados.

Configuração/Administração : gestão de agentes, políticas, retention, licenças/consumo e tuning de plataforma.

Instrumentação : automática e manual; OpenTelemetry; telemetria customizada.

Análise de dados : interpretação de métricas/traces/logs e queries customizadas na ferramenta.

Troubleshooting avançado usando recursos nativos (tracing, profiling, dependency map, RCA).

Dashboards/Workflows/Notebooks no APM com detecção de anomalias .

Observability stack ponta-a-ponta : Zabbix (métricas) e Elastic Stack (logs) .

Integrações & Automação : APIs, webhooks, conectores nativos (CMDB/ITSM/Zabbix/Elastic Stack/CI-CD).

Métodos ágeis (Scrum/Kanban); comunicação executiva; aprendizado contínuo.

Vivência com aplicações de missão crítica (desejável experiência em varejo).

Kubernetes/EKS e instrumentação em cloud;

Diferenciais

Conhecimento em definição de SLO/SLI, error budget e postmortems .

Capacity/forecast simples de tráfego/recursos

Benefícios:

  • Plano de saúde (Sulamérica)
  • Plano odontológico (Amil)
  • Seguro de vida
  • Vale refeição (Pluxee)


  • Barueri, Brasil SYSMAP Tempo inteiro

    **Descrição da vaga**: Principais responsabilidades Estratégia & Governança Desenhar e gerir a estratégia de APM (padrões de instrumentação, naming, amostragem, retenção, privacidade). Configuração & Administração de Plataforma (Dynatrace/DataDog) Configurar e otimizar a coleta e o desempenho da plataforma; gestão de agentes, políticas,...