Senior Site Reliability Engineer
Há 5 dias
Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.Sobre a AzionSomos uma empresa global de tecnologia especializada em aplicações e segurança digital.Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta.Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença.Sobre o CargoNa Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global.Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional.Seu ImpactoGarantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade;Atuar em todo o ciclo de incidentes críticos: detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas.Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio;Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces);Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança;Implementar redundância, fault isolation e estratégias de recuperação de desastres;Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade;Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável;Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering).O que Esperamos de VocêExperiência sólida em arquiteturas UNIX/Linux distribuídas de alta complexidade (microservices, sistemas em camadas);Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc;Experiência prática em definição e acompanhamento de SLIs/SLOs e error budgets;Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP/IP);Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI/CD);Conhecimento em linguagens como Python ou Golang;Inglês intermediário.Pontos a MaisFormação completa ou em andamento em áreas de Tecnologia da Informação;Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade);Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código;Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala;Contribuições open source e/ou participação em comunidades técnicas de SRE;Inglês avançado.Benefícios & Azion Way of LifeModelo de contratação CLT;Plano de saúde e odontológico;VR e VA flexível (Cartão Flash), inclusive em período de férias;Vale-transporte sem desconto em folha;Hackathons anuais internos;Auxílio mobilidade (valor adicional para deslocamento);Freestyle (incentivo para customização da estação de trabalho);Stock options (conforme política);Birthday day off;TotalPass;Horário de trabalho flexível (flexível mesmo);Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política);Programa de Intercâmbio internacional anual.Modelo FlexWorkOferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração.Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos.Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação.Após esse período, você terá a possibilidade de aplicar para o modelo híbrido, trabalhando presencialmente pelo menos três vezes por semana.Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo.Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião.Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações.Venha fazer parte da nossa equipeEstamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia#J-*****-Ljbffr
-
Site Reliability Engineer
2 semanas atrás
Porto Alegre, Brasil Canonical Tempo inteiro1 month ago Be among the first 25 applicantsCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets.Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT.Our customers include the world's leading...
-
Mid level Site Reliability Engineer
1 dia atrás
Porto Alegre, Brasil WEX Tempo inteiroJoin to apply for the Mid level Site Reliability Engineer role at WEX 1 week ago Be among the first 25 applicants About The Team/Role The WEX Site Reliability Engineering (SRE) team seeks individuals passionate about developing software and solutions for observability, incident response, reliability, performance, operational excellence, and compliance. As...
-
Site Reliability Engineer
3 semanas atrás
Porto Alegre, Brasil Azion Tempo inteiroJoin to apply for the Site Reliability Engineer (SRE) role at Azion 3 days ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (SRE) role at Azion About AzionWe are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the reliability...
-
Site Reliability Engineer
2 semanas atrás
Porto Alegre, Brasil AgileEngine Tempo inteiroSite Reliability Engineer (Middle/Senior) ID38916 Join to apply for the Site Reliability Engineer (Middle/Senior) ID38916 role at AgileEngine Overview AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development...
-
Site Reliability Engineer
Há 5 dias
Porto Alegre, Brasil Agileengine Tempo inteiroSite Reliability Engineer (Middle/Senior) ID*****Join to apply for the Site Reliability Engineer (Middle/Senior) ID***** role at AgileEngineOverviewAgileEngine is an Inc. **** company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries.We rank among the leaders in areas like application development and...
-
Site Reliability Engineer
Há 5 dias
Porto Alegre, Brasil WEX Brazil Technology Services Tempo inteiroAbout the Team/Role We are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business. This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems. The ideal candidate will have...
-
Site Reliability Engineer
2 semanas atrás
Porto Alegre, Rio Grande do Sul, Brasil WEX Tempo inteiro R$80.000 - R$120.000 por anoAbout The Team/RoleWe are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business. This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems.The ideal candidate will have...
-
Mid Level Site Reliability Engineer
2 semanas atrás
Porto Alegre, Brasil Wex Tempo inteiroThe WEX Site Reliability Engineering (SRE) team seeks individuals passionate about developing software and solutions for observability, incident response, reliability, performance, operational excellence, and compliance.As part of the Site Reliability Engineering organization, you will support internal stakeholders and Payment Platform teams, tackling...
-
Site Reliability Engineer
1 semana atrás
Porto Alegre, Brasil Wex Tempo inteiroAbout The Team/RoleWe are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business.This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems.The ideal candidate will have...
-
Site reliability engineer
3 semanas atrás
PORTO ALEGRE, Brasil azion Tempo inteiroAbout Azion We are a global leader in the application and security industry. Our platform allows companies to operate with agility, reducing latency and increasing the reliability of their applications. We are focused on simplifying application building and looking for passionate and innovative individuals to join our team! At Azion you will have the...