Especialista Observability

1 dia atrás


Barueri, São Paulo, Brasil SysMap Tempo inteiro R$80.000 - R$120.000 por ano
Description

Principais responsabilidades

Estratégia & Governança

  • Desenhar e gerir a estratégia de APM (padrões de instrumentação, naming, amostragem, retenção, privacidade).
  • Atuar como especialista de referência e consultor interno: evangelização, treinamento e melhores práticas.

Configuração & Administração de Plataforma (Dynatrace/DataDog)

  • Configurar e otimizar a coleta e o desempenho da plataforma; gestão de agentes, políticas, sampling/profiling.
  • Otimização de recursos e custos: licenças/consumo, data retention, quotas e performance da ferramenta.

Instrumentação & Telemetria

  • Instrumentar apps com OpenTelemetry (SDKs/auto-instrumentation/Collector) e/ou agentes nativos.
  • Coletar/enriquecer métricas, logs, traces; mapear dependências e serviços.

Análise de Performance & RCA

  • Deep-dive de performance (latência, throughput, error rate, disponibilidade).
  • Distributed tracing, dependency mapping e root cause analysis em ambientes complexos.

Dashboards, Notebooks, Workflows & Alertas

  • Construir dashboards na própria ferramenta de APM (Dynatrace/DataDog/Elastic APM/Kibana) com detecção de anomalias e KPIs técnicos/de negócio.
  • Desenvolver notebooks para investigações guiadas e storytelling técnico.
  • Criar/orquestrar workflows nativos (automação de resposta, enriquecimento, abertura/atualização de tickets).
  • Projetar alertas acionáveis (limiares dinâmicos, correlação) e reduzir falsos positivos.

Integrações, Automação & CMDB

  • Integrar o APM com CMDB/ITSM (ServiceNow) e ferramentas de Observabilidade como Zabbix e Elastic, CI/CD, webhooks e conectores nativos/APIs.
  • Automatizar provisionamento de monitores, auto-tagging, enriquecimento de eventos e integrações AzureDevops/CI-CD.

Liderança & Comunicação

  • Traduzir insights técnicos para públicos não técnicos e executivos.
Requirements

Requisitos (obrigatórios)

  • Domínio de plataforma APM (Dynatrace e/ou DataDog): funcionalidades principais e recursos avançados.
  • Configuração/Administração: gestão de agentes, políticas, retention, licenças/consumo e tuning de plataforma.
  • Instrumentação: automática e manual; OpenTelemetry; telemetria customizada.
  • Análise de dados: interpretação de métricas/traces/logs e queries customizadas na ferramenta.
  • Troubleshooting avançado usando recursos nativos (tracing, profiling, dependency map, RCA).
  • Dashboards/Workflows/Notebooks no APM com detecção de anomalias.
  • Observability stack ponta-a-ponta: Zabbix (métricas) e Elastic Stack (logs).
  • Integrações & Automação: APIs, webhooks, conectores nativos (CMDB/ITSM/Zabbix/Elastic Stack/CI-CD).
  • Métodos ágeis (Scrum/Kanban); comunicação executiva; aprendizado contínuo.
  • Vivência com aplicações de missão crítica (desejável experiência em varejo).
  • Kubernetes/EKS e instrumentação em cloud;

Diferenciais

  • Conhecimento em definição de SLO/SLI, error budget e postmortems.
  • Capacity/forecast simples de tráfego/recursos
Benefits
- Plano de saúde (Sulamérica)
- Plano odontológico (Amil)
- Seguro de vida
- Vale refeição (Pluxee)


  • Barueri, Brasil C&A Brasil Tempo inteiro

    Join to apply for the Especialista em Arquitetura de Soluções role at C&A Brasil . A C&A is a leading fashion retailer that values innovation, inclusivity, and professional growth. We provide an environment where you can be true to yourself, respect diversity, and make a positive impact through fashion. Responsibilities Define scalable, resilient, and...