Especialista Observability

1 semana atrás


Barueri, Brasil SYSMAP Tempo inteiro

**Descrição da vaga**:
Principais responsabilidades
Estratégia & Governança
Desenhar e gerir a estratégia de APM (padrões de instrumentação, naming, amostragem, retenção, privacidade).
Configuração & Administração de Plataforma (Dynatrace/DataDog)
Configurar e otimizar a coleta e o desempenho da plataforma; gestão de agentes, políticas, sampling/profiling.
**Otimização de recursos e custos**: licenças/consumo, data retention, quotas e performance da ferramenta.
Instrumentação & Telemetria
Instrumentar apps com OpenTelemetry (SDKs/auto-instrumentation/Collector) e/ou agentes nativos.
Coletar/enriquecer métricas, logs, traces ; mapear dependências e serviços.
Análise de Performance & RCA
Deep-dive de performance (latência, throughput, error rate, disponibilidade).
Distributed tracing, dependency mapping e root cause analysis em ambientes complexos.
Dashboards, Notebooks, Workflows & Alertas
Construir dashboards na própria ferramenta de APM (Dynatrace/DataDog/Elastic APM/Kibana) com detecção de anomalias e KPIs técnicos/de negócio.
Desenvolver notebooks para investigações guiadas e storytelling técnico.
Criar/orquestrar workflows nativos (automação de resposta, enriquecimento, abertura/atualização de tickets).
Projetar alertas acionáveis (limiares dinâmicos, correlação) e reduzir falsos positivos.
Integrações, Automação & CMDB
Integrar o APM com CMDB/ITSM (ServiceNow) e ferramentas de Observabilidade como Zabbix e Elastic, CI/CD, webhooks e conectores nativos/APIs.
Automatizar provisionamento de monitores, auto-tagging, enriquecimento de eventos e integrações AzureDevops/CI-CD.
Liderança & Comunicação
Traduzir insights técnicos para públicos não técnicos e executivos.
**Requerimentos**:
Requisitos (obrigatórios)
**Domínio de plataforma APM (Dynatrace e/ou DataDog)**: funcionalidades principais e recursos avançados.
**Configuração/Administração**: gestão de agentes, políticas, retention, licenças/consumo e tuning de plataforma.
**Instrumentação**: automática e manual; OpenTelemetry; telemetria customizada.
**Análise de dados**: interpretação de métricas/traces/logs e queries customizadas na ferramenta.
Troubleshooting avançado usando recursos nativos (tracing, profiling, dependency map, RCA).
Dashboards/Workflows/Notebooks no APM com detecção de anomalias.
**Observability stack ponta-a-ponta**: Zabbix (métricas) e Elastic Stack (logs).
**Integrações & Automação**: APIs, webhooks, conectores nativos (CMDB/ITSM/Zabbix/Elastic Stack/CI-CD).
Métodos ágeis (Scrum/Kanban); comunicação executiva; aprendizado contínuo.
Vivência com aplicações de missão crítica (desejável experiência em varejo).
Kubernetes/EKS e instrumentação em cloud;
Diferenciais
Conhecimento em definição de SLO/SLI, error budget e postmortems.
Capacity/forecast simples de tráfego/recursos
**Benefícios**:

- Plano de saúde (Sulamérica)
- Plano odontológico (Amil)
- Seguro de vida
- Vale refeição (Pluxee)


  • Especialista Observability

    2 semanas atrás


    Barueri, São Paulo, Brasil SysMap Tempo inteiro R$90.000 - R$120.000 por ano

    Descrição da vaga:Principais responsabilidadesEstratégia & GovernançaDesenhar e gerir a estratégia de APM (padrões de instrumentação, naming, amostragem, retenção, privacidade).Atuar como especialista de referência e consultor interno : evangelização, treinamento e melhores práticas.Configuração & Administração de Plataforma...