
Senior Site Reliability Engineer
1 semana atrás
Sobre a Azion
Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.
Sobre a Azion
Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.
Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta. Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença.
Sobre o Cargo
Na Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global. Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.
Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional.
Seu Impacto
- Garantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade;
- Atuar em todo o ciclo de incidentes críticos: detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas.
- Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio;
- Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces);
- Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança;
- Implementar redundância, fault isolation e estratégias de recuperação de desastres;
- Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade;
- Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável;
- Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering).
O que Esperamos de Você
- Experiência sólida em arquiteturas UNIX/Linux distribuídas de alta complexidade (microservices, sistemas em camadas);
- Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc;
- Experiência prática em definição e acompanhamento de SLIs/SLOs e error budgets;
- Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP/IP);
- Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI/CD);
- Conhecimento em linguagens como Python ou Golang;
- Inglês intermediário.
Pontos a Mais
- Formação completa ou em andamento em áreas de Tecnologia da Informação;
- Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade);
- Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código;
- Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala;
- Contribuições open source e/ou participação em comunidades técnicas de SRE;
- Inglês avançado.
Benefícios & Azion Way of Life
- Modelo de contratação CLT;
- Plano de saúde e odontológico;
- VR e VA flexível (Cartão Flash), inclusive em período de férias;
- Vale-transporte sem desconto em folha;
- Hackathons anuais internos;
- Auxílio mobilidade (valor adicional para deslocamento);
- Freestyle (incentivo para customização da estação de trabalho);
- Stock options (conforme política);
- Birthday day off;
- TotalPass;
- Horário de trabalho flexível (flexível mesmo);
- Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política);
- Programa de Intercâmbio internacional anual.
Modelo FlexWork
Oferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração. Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos. Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação.
Após esse período, você terá a possibilidade de aplicar para o modelo híbrido, trabalhando presencialmente pelo menos três vezes por semana. Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo.
Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião. Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações.
Venha fazer parte da nossa equipe Estamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia
#J-18808-Ljbffr-
Site Reliability Engineer
4 semanas atrás
Porto Alegre, Brasil Sur LATAM Tempo inteiro2 weeks ago Be among the first 25 applicants Get AI-powered advice on this job and more exclusive features. Our US based client is looking for a mission-driven Site Reliability Engineer to support and scale the infrastructure powering their secure, mission-critical SaaS platform.You must be confident in operating and debugging both modern infrastructure...
-
Site Reliability Engineer
Há 4 dias
Porto Alegre, Brasil Canonical Tempo inteiro1 month ago Be among the first 25 applicants Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our customers include the world's...
-
Site Reliability Engineer
Há 4 dias
Porto Alegre, Brasil Azion Tempo inteiroJoin to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About Azion We are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the reliability...
-
Remote Site Reliability Engineer
4 semanas atrás
Porto Alegre, Brasil INDI Staffing Services Tempo inteiroOverview We are looking for a Site Reliability Engineer to build and maintain highly reliable, scalable, and secure OpenShift/Kubernetes clusters. Approach the problem of building and maintaining production systems from a software engineering perspective with a focus on automation and reliability. Responsibilities Build, automate, and maintain...
-
Site Reliability Engineer
4 semanas atrás
Porto Alegre, Brasil Azion Tempo inteiroJoin to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About AzionWe are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the...
-
Site Reliability Engineer
4 semanas atrás
Porto Alegre, Brasil Azion Tempo inteiroJoin to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About Azion We are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the...
-
Site Reliability Engineer
3 semanas atrás
Porto Alegre, Brasil BairesDev Tempo inteiroOverview At BairesDev, we've been leading technology projects for over 15 years. We deliver cutting-edge solutions to giants like Google and to startups in Silicon Valley. Our 4,000+ remote team includes top tech talent, and we offer roles that drive significant impact worldwide. This position is for a Site Reliability Engineer to build and maintain highly...
-
Senior Site Reliability
Há 4 dias
Porto Alegre, Brasil Canonical Tempo inteiroSenior Site Reliability / Gitops EngineerCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. We are hiring a Senior Site...
-
Site Reliability Engineer
Há 6 dias
Porto Alegre, Rio Grande do Sul, Brasil WEX Tempo inteiro R$80.000 - R$120.000 por anoAbout The Team/RoleWe are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business. This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems.The ideal candidate will have...
-
Mid Level Site Reliability Engineer
2 semanas atrás
Porto Alegre, Brasil Wex Tempo inteiroAbout The Team/RoleThe WEX Site Reliability Engineering (SRE) team seeks individuals passionate about developing software and solutions for observability, incident response, reliability, performance, operational excellence, and compliance.As part of the Site Reliability Engineering organization, you will support internal stakeholders and Payment Platform...