Senior Site Reliability Engineer
3 semanas atrás
Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.
Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta. Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença.
Sobre o CargoNa Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global. Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.
Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional. Seu ImpactoGarantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade;Atuar em todo o ciclo de incidentes críticos: detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas.
Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio;Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces);Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança;Implementar redundância, fault isolation e estratégias de recuperação de desastres;Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade;Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável;Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering). O que Esperamos de VocêExperiência sólida em arquiteturas UNIX/Linux distribuídas de alta complexidade (microservices, sistemas em camadas);Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc;Experiência prática em definição e acompanhamento de SLIs/SLOs e error budgets;Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP/IP);Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI/CD);Conhecimento em linguagens como Python ou Golang;Inglês intermediário.
Pontos a MaisFormação completa ou em andamento em áreas de Tecnologia da Informação;Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade);Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código;Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala;Contribuições open source e/ou participação em comunidades técnicas de SRE;Inglês avançado. Benefícios & Azion Way of LifeModelo de contratação CLT;Plano de saúde e odontológico;VR e VA flexível (Cartão Flash), inclusive em período de férias;Vale-transporte sem desconto em folha;Hackathons anuais internos;Auxílio mobilidade (valor adicional para deslocamento);Freestyle (incentivo para customização da estação de trabalho);Stock options (conforme política);Birthday day off;TotalPass;Horário de trabalho flexível (flexível mesmo);Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política);Programa de Intercâmbio internacional anual.
Modelo FlexWorkOferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração. Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos.
Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação. Após esse período, você terá a possibilidade de aplicar para o modelo híbrido, trabalhando presencialmente pelo menos três vezes por semana.
Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo. Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião.
Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações. Venha fazer parte da nossa equipeEstamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia
-
Site Reliability Engineer
1 semana atrás
Porto Alegre, Brasil Azion Tempo inteiroJoin to apply for the Site Reliability Engineer (SRE) role at Azion3 days ago Be among the first 25 applicantsJoin to apply for the Site Reliability Engineer (SRE) role at AzionAbout AzionWe are a global leader in the application and security industry.Our platform allows companies to operate with agility, reducing latency and increasing the reliability of...
-
Site Reliability Engineer
2 semanas atrás
Porto Alegre, Brasil HCLTech Tempo inteiroHandling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution. Performing deep-dive application troubleshooting and identifying preventive actions. Managing CIRS-related requests including deployments, feature toggles, and data fixes. Following up on major production incidents and coordinating with...
-
Site Reliability Engineer
Há 7 dias
Porto Alegre, Brasil Hcltech Tempo inteiroHandling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution.Performing deep-dive application troubleshooting and identifying preventive actions.Managing CIRS-related requests including deployments, feature toggles, and data fixes.Following up on major production incidents and coordinating with...
-
Site Reliability Engineer
Há 7 dias
Porto Alegre, Brasil Canonical Tempo inteiroCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets.Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT.Our customers include the world's leading public cloud and silicon providers, and...
-
Senior Site Reliability Engineer
Há 7 dias
Porto Alegre, Brasil Azion Tempo inteiroSobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma...
-
Senior Site Reliability Engineer
Há 7 dias
Porto Alegre, Brasil Azion Tempo inteiroSobre a Azion Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas. Sobre a Azion Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa...
-
Senior Site Reliability Engineer I
Há 2 dias
Porto Alegre, Rio Grande do Sul, Brasil Talkdesk Tempo inteiroAt Talkdesk, we are courageous innovators focused on redefining the customer experience, making the impossible possible for companies globally. We champion an inclusive and diverse culture representative of the communities in which we live and serve. And, we give back to our community by volunteering our time, supporting non-profits, and minimizing our...
-
Site Reliability Engineer
4 semanas atrás
Porto Velho, Brasil Psm Company Tempo inteiroSobre a vaga A PSM Company é especializada na identificação de Talentos para as áreas de TI / Telecom como também para as áreas operacionais e administrativas. Nossa história de sucesso, está baseada em nosso modelo de negócios que proporcionam assertividade e qualidade no processo seletivo, baixo Turn Over e isenção de riscos e passivos...
-
Site Reliability Engineer
1 semana atrás
Porto Velho, Brasil Psm Company Tempo inteiroSobre a vaga A PSM Company é especializada na identificação de Talentos para as áreas de TI / Telecom como também para as áreas operacionais e administrativas.Nossa história de sucesso, está baseada em nosso modelo de negócios que proporcionam assertividade e qualidade no processo seletivo, baixo Turn Over e isenção de riscos e passivos...
-
Site Reliability
Há 2 dias
Porto Alegre, Brasil Canonical Tempo inteiro1 day ago Be among the first 25 applicantsCanonical is a leading provider of open source software and operating systems to the globalenterprise and technology markets.Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT.Our customers include the world's...