Especialista Sre Com Foco Em Observabilidade

Há 3 dias


Belo Horizonte, Brasil Ródio Tech Soluções Tempo inteiro

Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH. Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas. Esperamos alguém que atue de forma estratégica, proponha padrões técnicos, eleve a maturidade dos nossos sistemas e dissemine boas práticas de visibilidade, performance e resiliência em toda a organização. O candidato ideal é colaborativo, analítico, orientado a resultados e com forte senso de dono, sempre alinhado aos valores e à visão da empresa. Atividades a serem desenvolvidas: Como Especialista SRE, essa pessoa será protagonista na evolução da plataforma de observabilidade da Empresa. Trará valor ao consolidar métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes. Sua atuação será decisiva para o aumento da confiabilidade dos serviços, redução de indisponibilidades, melhoria contínua da performance e apoio estratégico às áreas de tecnologia e produto. Com sua expertise, teremos uma operação mais preditiva, escalável e resiliente. - Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces. - Definir, padronizar e manter painéis e alertas para serviços críticos da organização. - Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados. - Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas. - Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua. - Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas. - Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações. - Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações. - Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas. - Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes. Principais conhecimentos: - Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace. - Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos. - Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio. - Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares. - Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker). - Integração com ferramentas de alerta e resposta a incidentes: Opsgenie, PagerDuty, VictorOps. - Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell). - Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis). - Criação e manutenção de documentação operacional (runbooks, playbooks, checklists). - Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade. Perfil acadêmico e habilidades: - Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas. - Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento. - Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica. - Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais. - Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD. - Capacidade de correlacionar dados de observabilidade com impacto no negócio. - Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes). - Fluência em automação com linguagens como Python, Shell Script, Go ou similares. - Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas. - Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua. Qualificações Desejáveis: - Certificações em observabilidade e confiabilidade: Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation. - Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry. - Experiência com Chaos Engineering e validação de resiliência. - Participação em incidentes críticos com liderança técnica na resposta. - Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos. - Experiência com automação de runbooks e fluxos de resposta a incidentes. - Familiaridade com práticas de FinOps e eficiência operacional em observabilidade. - Participação em comunidades técnicas de SRE, DevOps e observabilidade. - Contribuições para ferramentas ou boas práticas open source. - Inglês técnico para leitura, escrita e participação em fóruns internacionais. Modelo de contratação: Contrato: Pessoa Jurídica (PJ) Modelo de atuação: Modelo: 100% Remoto Na RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo



  • Belo Horizonte, Brasil Ródio Tech Soluções Tempo inteiro

    Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH.Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a)...

  • Analista De Observabilidade

    1 semana atrás


    Belo Horizonte, Brasil T-Systems Do Brasil Tempo inteiro

    Descrição da função: Analista de Observabilidade com experiência em monitoramento de infraestrutura, aplicações e serviços usando Zabbix e Dynatrace.Atua na implementação de soluções, análise de métricas e automação de alertas, garantindo alta disponibilidade e confiabilidade dos ambientes corporativos.Sobre a vaga: Horário: 8:00h às...


  • Belo Horizonte, Brasil T-Systems Do Brasil Tempo inteiro

    Descrição da função: Analista de Observabilidade com experiência em monitoramento de infraestrutura, aplicações e serviços usando Zabbix e Dynatrace.Atua na implementação de soluções, análise de métricas e automação de alertas, garantindo alta disponibilidade e confiabilidade dos ambientes corporativos.Sobre a vaga: Horário: 8:00h às...

  • Sre Pleno

    Há 6 dias


    Belo Horizonte, Brasil Rpe Tempo inteiro

    Com mais de 20 anos de experiência e inovação, a RPE é uma empresa que transforma o varejo ao conectar tecnologia, expertise e resultados.A RPE tem como objetivo viabilizar o amplo crescimento dos negócios varejistas e da economia nacional por meio de soluções ágeis, robustas, seguras e integradas a todo ecossistema de serviços financeiros.Com mais...

  • Sre

    2 semanas atrás


    Belo Horizonte, Brasil Fit Economia De Energia S.A. Tempo inteiro

    Sobre nós A FIT Energia, uma empresa do grupo Santander, é uma plataforma de geração distribuída com presença em todo o território nacional, conectando geradores e consumidores de energia.Nosso objetivo é viabilizar e promover o consumo de energia limpa e mais acessível para todos.Com o apoio dos nossos clientes, já evitamos mais de 4 mil toneladas...

  • SRE

    1 semana atrás


    Belo Horizonte, Brasil FIT Economia de Energia Tempo inteiro

    Sobre nós A FIT Energia, uma empresa do grupo Santander, é uma plataforma de geração distribuída com presença em todo o território nacional, conectando geradores e consumidores de energia. Nosso objetivo é viabilizar e promover o consumo de energia limpa e mais acessível para todos. Com o apoio dos nossos clientes, já evitamos mais de 4 mil...

  • SRE

    1 semana atrás


    Belo Horizonte, Brasil Fitenergia Tempo inteiro

    Sobre nós A FIT Energia, uma empresa do grupo Santander, é uma plataforma de geração distribuída com presença em todo o território nacional, conectando geradores e consumidores de energia. Nosso objetivo é viabilizar e promover o consumo de energia limpa e mais acessível para todos. Com o apoio dos nossos clientes, já evitamos mais de 4 mil...

  • Sre

    3 semanas atrás


    Belo Horizonte, Brasil Netvagas Tempo inteiro

    Sobre nós A FIT Energia, uma empresa do grupo Santander, é uma plataforma de geração distribuída com presença em todo o território nacional, conectando geradores e consumidores de energia. Nosso objetivo é viabilizar e promover o consumo de energia limpa e mais acessível para todos. Com o apoio dos nossos clientes, já evitamos mais de 4 mil...

  • Sre

    3 semanas atrás


    BELO HORIZONTE, Brasil FIT ECONOMIA DE ENERGIA S.A. Tempo inteiro

    Sobre nós A FIT Energia, uma empresa do grupo Santander, é uma plataforma de geração distribuída com presença em todo o território nacional, conectando geradores e consumidores de energia. Nosso objetivo é viabilizar e promover o consumo de energia limpa e mais acessível para todos. Com o apoio dos nossos clientes, já evitamos mais de 4 mil...


  • Belo Horizonte, Brasil YAPP Tempo inteiro

    A Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que...