Especialista Sre Com Foco Em Observabilidade

Há 2 dias


Várzea Grande, Brasil Ródio Tech Soluções Tempo inteiro

Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH.

Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas. Esperamos alguém que atue de forma estratégica, proponha padrões técnicos, eleve a maturidade dos nossos sistemas e dissemine boas práticas de visibilidade, performance e resiliência em toda a organização. O candidato ideal é colaborativo, analítico, orientado a resultados e com forte senso de dono, sempre alinhado aos valores e à visão da empresa.

Atividades a serem desenvolvidas:

Como Especialista SRE, essa pessoa será protagonista na evolução da plataforma de observabilidade da Empresa. Trará valor ao consolidar métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes. Sua atuação será decisiva para o aumento da confiabilidade dos serviços, redução de indisponibilidades, melhoria contínua da performance e apoio estratégico às áreas de tecnologia e produto. Com sua expertise, teremos uma operação mais preditiva, escalável e resiliente.

- Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.

- Definir, padronizar e manter painéis e alertas para serviços críticos da organização.

- Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.

- Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.

- Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.

- Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.

- Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.

- Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.

- Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.

- Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.

Principais conhecimentos:

- Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace.

- Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos.

- Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio.

- Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.

- Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).

- Integração com ferramentas de alerta e resposta a incidentes: Opsgenie, PagerDuty, VictorOps.

- Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell).

- Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis).

- Criação e manutenção de documentação operacional (runbooks, playbooks, checklists).

- Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.

Perfil acadêmico e habilidades:

- Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.

- Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.

- Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.

- Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.

- Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD.

- Capacidade de correlacionar dados de observabilidade com impacto no negócio.

- Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).

- Fluência em automação com linguagens como Python, Shell Script, Go ou similares.

- Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas.

- Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua. Qualificações Desejáveis:

- Certificações em observabilidade e confiabilidade: Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation.

- Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry.

- Experiência com Chaos Engineering e validação de resiliência.

- Participação em incidentes críticos com liderança técnica na resposta.

- Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.

- Experiência com automação de runbooks e fluxos de resposta a incidentes.

- Familiaridade com práticas de FinOps e eficiência operacional em observabilidade.

- Participação em comunidades técnicas de SRE, DevOps e observabilidade.

- Contribuições para ferramentas ou boas práticas open source.

- Inglês técnico para leitura, escrita e participação em fóruns internacionais.

Modelo de contratação:

- Contrato: Pessoa Jurídica (PJ)

Modelo de atuação:

- Modelo: 100% Remoto

Na RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo


  • Analista SRE Sênior

    3 semanas atrás


    Rio Grande, Brasil Clínica Experts Tempo inteiro

    Vaga Analista SRE Sênior - Clínica ExpertsSobre a empresa OClínica Expertsé uma plataforma completa de gestão para clínicas de saúde, estética e bem-estar, utilizada diariamente por mais de 7.500 clínicas e 16.000 usuários. Entregamos soluções que integram agenda, prontuário, financeiro, estoque, comunicação omnichannel e inteligência...

  • Analista SRE Sênior

    3 semanas atrás


    Rio Grande, Brasil Clínica Experts Tempo inteiro

    Vaga Analista SRE Sênior - Clínica Experts Sobre a empresa O Clínica Experts é uma plataforma completa de gestão para clínicas de saúde, estética e bem-estar, utilizada diariamente por mais de 7.500 clínicas e 16.000 usuários. Entregamos soluções que integram agenda, prontuário, financeiro, estoque, comunicação omnichannel e...


  • Várzea Grande, Brasil AGGRANDIZE Tempo inteiro

    Olá! A Aggrandize nasceu em 2015 com a missão de engrandecer pessoas e negócios. Guiados por valores como adaptabilidade, colaboração, foco no cliente e visão de dono, oferecemos soluções que transformam desafios em oportunidades. Somos especialistas em Platform Engineering, Data Analytics, Modern Applications e Cybersecurity, sempre com o...

  • Devops Sênior

    Há 4 dias


    Várzea Grande, Brasil MOL Tempo inteiro

    Localização: São Paulo / SP Tipo Vaga: Home Office (1x por mês presencial) Contratação: PJ Tempo Integral Sobre a MOL Somos a MOL – Mediação Online, referência em soluções digitais para resolução de conflitos. Nossas plataformas conectam empresas e consumidores de forma eficiente, escalável e com foco na experiência do usuário. Estamos...

  • SRE/DevOps

    3 semanas atrás


    Serra Grande, Brasil J17 Bank Tempo inteiro

    Diretora de Recursos Humanos na J17 Bank| Especialista em RH com experiência em clínica psicológica Somos o J17 Bank, a primeira instituição financeira de Londrina, PR. Com décadas de experiência no mercado de capitais e um corpo executivo de primeira linha, a instituição nascida no interior, entrega produtos para todo o Brasil. Sobre a vaga Estamos...


  • Várzea Grande, Brasil Exadel Tempo inteiro

    Por que ingressar na Exadel Ingresse em uma organização global de engenharia que valoriza o trabalho artesanal, a colaboração e a melhoria contínua. Na Exadel, você trabalhará com tecnologias modernas, criará sistemas escaláveis e contribuirá para soluções utilizadas em ambientes de alto impacto e missão crítica. Priorizamos código limpo,...


  • Várzea Grande, Brasil Vega Engenharia e Arquitetura Tempo inteiro

    Engenheiro Civil – Especialista Em Estruturas De Concreto Armado Join to apply for the Engenheiro Civil – Especialista Em Estruturas De Concreto Armado role at Vega Engenharia e Arquitetura Contrata-se engenheiro(a) engenheiro civil especialista em estrutura de concreto armado com foco em projetos de edifícios e industriais. Experiência softwares de...


  • Várzea Grande, Brasil GRUPO SBF Tempo inteiro

    O seu papel como Especialista em Engenharia de Software Backend será: - Desenvolver programação do início ao fim, incluindo definições de arquitetura, testes e rollout em produção; - Liderança no desenvolvimento de projetos com arquitetura de microserviços, consumo e geração de eventos em Streaming, API's; - Garantir a funcionalidade,...

  • Site Reliability Engineer Pl

    4 semanas atrás


    Várzea Grande, Brasil Turbi Tempo inteiro

    E aí, tudo azul por aí? A Turbi é a locadora do futuro: 100% digital, movida a tecnologia, gente boa e paixão por transformar a forma como as pessoas se locomovem. A gente abre o carro pelo app (sim, sem chave!) e acreditamos que a inovação de verdade começa com um time engajado e com liberdade para criar. Estamos procurando uma pessoa para a...

  • Especialista Azure

    4 semanas atrás


    Várzea Grande, Brasil Psm Company Tempo inteiro

    A PSM Company é especializada na identificação de Talentos para as áreas de TI / Telecom como também para as áreas operacionais e administrativas. Nossa história de sucesso, está baseada em nosso modelo de negócios que proporcionam assertividade e qualidade no processo seletivo, baixo Turn Over e isenção de riscos e passivos...