Senior Site Reliability Engineer

Há 7 dias


Porto Alegre, Brasil Azion Tempo inteiro

Sobre a Azion Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas. Sobre a Azion Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.

Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta. Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença. Sobre o Cargo Na Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global. Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.

Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional. Seu Impacto Garantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade; Atuar em todo o ciclo de incidentes críticos: detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas. Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio; Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces); Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança; Implementar redundância, fault isolation e estratégias de recuperação de desastres; Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade; Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável; Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering). O que Esperamos de Você Experiência sólida em arquiteturas UNIX/Linux distribuídas de alta complexidade (microservices, sistemas em camadas); Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc; Experiência prática em definição e acompanhamento de SLIs/SLOs e error budgets; Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP/IP); Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI/CD); Conhecimento em linguagens como Python ou Golang; Inglês intermediário.

Pontos a Mais Formação completa ou em andamento em áreas de Tecnologia da Informação; Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade); Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código; Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala; Contribuições open source e/ou participação em comunidades técnicas de SRE; Inglês avançado. Benefícios & Azion Way of Life Modelo de contratação CLT; Plano de saúde e odontológico; VR e VA flexível (Cartão Flash), inclusive em período de férias; Vale-transporte sem desconto em folha; Hackathons anuais internos; Auxílio mobilidade (valor adicional para deslocamento); Freestyle (incentivo para customização da estação de trabalho); Stock options (conforme política); Birthday day off; TotalPass; Horário de trabalho flexível (flexível mesmo); Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política); Programa de Intercâmbio internacional anual. Modelo FlexWork Oferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração. Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos.

Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação. Após esse período, você terá a possibilidade de aplicar para o modelo híbrido, trabalhando presencialmente pelo menos três vezes por semana. Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo. Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião.

Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações. Venha fazer parte da nossa equipe Estamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia #J-18808-Ljbffr


  • Site Reliability Engineer

    1 semana atrás


    Porto Alegre, Brasil Azion Tempo inteiro

    Join to apply for the Site Reliability Engineer (SRE) role at Azion3 days ago Be among the first 25 applicantsJoin to apply for the Site Reliability Engineer (SRE) role at AzionAbout AzionWe are a global leader in the application and security industry.Our platform allows companies to operate with agility, reducing latency and increasing the reliability of...


  • Porto Alegre, Brasil Azion Tempo inteiro

    Join to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About AzionWe are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the reliability...


  • Porto Alegre, Brasil Azion Tempo inteiro

    Join to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About Azion We are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the reliability...

  • Site Reliability Engineer

    2 semanas atrás


    Porto Alegre, Brasil HCLTech Tempo inteiro

    Handling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution. Performing deep-dive application troubleshooting and identifying preventive actions. Managing CIRS-related requests including deployments, feature toggles, and data fixes. Following up on major production incidents and coordinating with...


  • Porto Alegre, Brasil HCLTech Tempo inteiro

    Handling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution. Performing deep-dive application troubleshooting and identifying preventive actions. Managing CIRS-related requests including deployments, feature toggles, and data fixes. Following up on major production incidents and coordinating with...


  • Porto Alegre, Brasil Hcltech Tempo inteiro

    Handling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution.Performing deep-dive application troubleshooting and identifying preventive actions.Managing CIRS-related requests including deployments, feature toggles, and data fixes.Following up on major production incidents and coordinating with...


  • Porto Alegre, Brasil Canonical Tempo inteiro

    Company Overview Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. The company is a pioneer of global distributed collaboration, with...


  • Porto Alegre, Brasil Canonical Tempo inteiro

    Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our customers include the world's leading public cloud and silicon providers, and...


  • Porto Alegre, Brasil Canonical Tempo inteiro

    Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets.Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT.Our customers include the world's leading public cloud and silicon providers, and...


  • Porto Alegre, Brasil Azion Tempo inteiro

    Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma...