Especialista SRE com foco em Observabilidade

Há 4 dias


Brazil, BR Ródio Tech Soluções Tempo inteiro

Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH.


Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas. Esperamos alguém que atue de forma estratégica, proponha padrões técnicos, eleve a maturidade dos nossos sistemas e dissemine boas práticas de visibilidade, performance e resiliência em toda a organização. O candidato ideal é colaborativo, analítico, orientado a resultados e com forte senso de dono, sempre alinhado aos valores e à visão da empresa.


Atividades a serem desenvolvidas:


Como Especialista SRE, essa pessoa será protagonista na evolução da plataforma de observabilidade da Empresa. Trará valor ao consolidar métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes. Sua atuação será decisiva para o aumento da confiabilidade dos serviços, redução de indisponibilidades, melhoria contínua da performance e apoio estratégico às áreas de tecnologia e produto. Com sua expertise, teremos uma operação mais preditiva, escalável e resiliente.


• Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.

• Definir, padronizar e manter painéis e alertas para serviços críticos da organização.

• Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.

• Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.

• Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.

• Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.

• Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.

• Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.

• Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.

• Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.


Principais conhecimentos:

• Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace.

• Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos.

• Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio.

• Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.

• Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).

• Integração com ferramentas de alerta e resposta a incidentes: Opsgenie, PagerDuty, VictorOps.

• Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell).

• Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis).

• Criação e manutenção de documentação operacional (runbooks, playbooks, checklists).

• Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.


Perfil acadêmico e habilidades:

• Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.

• Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.

• Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.

• Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.

• Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD.

• Capacidade de correlacionar dados de observabilidade com impacto no negócio.

• Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).

• Fluência em automação com linguagens como Python, Shell Script, Go ou similares.

• Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas.

• Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua. Qualificações Desejáveis:

• Certificações em observabilidade e confiabilidade: Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation.

• Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry.

• Experiência com Chaos Engineering e validação de resiliência.

• Participação em incidentes críticos com liderança técnica na resposta.

• Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.

• Experiência com automação de runbooks e fluxos de resposta a incidentes.

• Familiaridade com práticas de FinOps e eficiência operacional em observabilidade.

• Participação em comunidades técnicas de SRE, DevOps e observabilidade.

• Contribuições para ferramentas ou boas práticas open source.

• Inglês técnico para leitura, escrita e participação em fóruns internacionais.


Modelo de contratação:


  • Contrato: Pessoa Jurídica (PJ)


Modelo de atuação:


  • Modelo: 100% Remoto


Na RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo



  • Brazil, BR AGGRANDIZE Tempo inteiro

    Olá!A Aggrandize nasceu em 2015 com a missão de engrandecer pessoas e negócios. Guiados por valores como adaptabilidade, colaboração, foco no cliente e visão de dono, oferecemos soluções que transformam desafios em oportunidades.Somos especialistas em Platform Engineering, Data Analytics, Modern Applications e Cybersecurity, sempre com o compromisso...


  • Brazil, BR GRUPO SBF Tempo inteiro

    O seu papel como Especialista em Engenharia de Software Backend será:Desenvolver programação do início ao fim, incluindo definições de arquitetura, testes e rollout em produção;Liderança no desenvolvimento de projetos com arquitetura de microserviços, consumo e geração de eventos em Streaming, API's;Garantir a funcionalidade, manutenibilidade e...

  • DevOps Specialist

    Há 2 dias


    Brazil, BR Stefanini Brasil Tempo inteiro

    Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.Ao se juntar à Stefanini, você se torna parte de...


  • Brazil, BR Exadel Tempo inteiro

    Por que ingressar na ExadelIngresse em uma organização global de engenharia que valoriza o trabalho artesanal, a colaboração e a melhoria contínua. Na Exadel, você trabalhará com tecnologias modernas, criará sistemas escaláveis e contribuirá para soluções utilizadas em ambientes de alto impacto e missão crítica. Priorizamos código limpo,...

  • Site Reliability Engineer PL

    4 semanas atrás


    Brazil, BR Turbi Tempo inteiro

    E aí, tudo azul por aí? A Turbi é a locadora do futuro: 100% digital, movida a tecnologia, gente boa e paixão por transformar a forma como as pessoas se locomovem. A gente abre o carro pelo app (sim, sem chave!) e acreditamos que a inovação de verdade começa com um time engajado e com liberdade para criar.Estamos procurando uma pessoa para a posição...

  • Especialista Azure

    4 semanas atrás


    Brazil, BR Psm Company Tempo inteiro

    A PSM Company é especializada na identificação de Talentos para as áreas de TI / Telecom como também para as áreas operacionais e administrativas. Nossa história de sucesso, está baseada em nosso modelo de negócios que proporcionam assertividade e qualidade no processo seletivo, baixo Turn Over e isenção de riscos e passivos...

  • DevOps Engineer

    3 semanas atrás


    Brazil, BR Mouts TI Tempo inteiro

    Oportunidade: DevOps Engineer Conheça a Mouts: https://mouts.info/ Modalidade: Remoto.Buscamos um DevOps Engineer para atuação 100% remota em um projeto estratégico com foco em CI/CD, GitOps, automação de infraestrutura e observabilidade. O que você faráEvoluir e padronizar pipelines de CI/CDImplementar GitOps e versionamento de pipelinesIntegrar e...


  • Brazil, BR Stefanini Brasil Tempo inteiro

    Responsabilidades e atribuições:​Desenvolvimento de soluções robustas e escaláveis em ambientes bancários.Manutenção e evolução de sistemas legados em Java, além de migração para arquiteturas modernas (microserviços).Implementação de testes unitários e regressivos para garantir a qualidade do código.Aplicação de práticas de...


  • Brazil, BR mybest,Inc. Tempo inteiro

    Especialista em Atividades ao Ar Livre | Colaboração Paga (Consultoria Técnica)Descrição:A mybest Brasil — plataforma de recomendações de produtos com origem no Japão e presente em diversos países — está em busca de um(a) especialista em atividades ao ar livre para colaborar como consultor(a) técnico(a) em nossos guias de compra e artigos...

  • Cloud Engineer

    2 semanas atrás


    Brazil, BR K2 Solutions Tempo inteiro

    Analista Cloud Azure - pleno/sênior | Comunicação em Espanhol fluenteRemoto (Brasil) ou Híbrido (SP/Região)Buscamos um(a) especialista em Microsoft Azure com mentalidade DevOps/SRE e Espanhol avançado/fluente para atuar em projetos internacionais.Será a peça-chave na sustentação e evolução de uma infraestrutura de nuvem crítica. Sua missão...