Senior Site Reliability Engineer
Há 2 dias
Trabalho híbrido na região de Pinheiros/ SP - 3x por semana no escritório Estamos selecionando um Senior Site Reliability Engineer - SRE para se juntar ao nosso time e desempenhar um papel essencial na manutenção, automação e melhoria da confiabilidade dos sistemas que impulsionam a rede logística da empresa em múltiplas regiões.Essa pessoa garantirá que a plataforma permaneça resiliente, observável e de alto desempenho, ao mesmo tempo em que possibilita inovação rápida e entregas seguras em larga escala.Responsabilidades: Definir, implementar e monitorar Service Level Objectives (SLOs), SLIs e error budgets em serviços principais.Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas.Automatizar tarefas operacionais por meio de infraestrutura como código (IaC) e pipelines de CI/CD.Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas.Desenvolver processos de resposta a incidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas.Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência.Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda.Melhorar continuamente os pipelines de deploy, monitoramento e procedimentos de recuperação.Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade.Requisitos: Graduação em Ciência da Computação, Engenharia ou experiência equivalente.5+ anos de experiência em funções de Site Reliability, DevOps ou Engenharia de Produção.Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC).Forte domínio de ferramentas de observabilidade (NewRelic, Grafana, Prometheus, ElasticSearch, Kibana).Experiência na manutenção de sistemas orientados a eventos com Kafka.Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy.Experiência na construção e manutenção de pipelines de CI/CD.Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho.Disponibilidade para trabalhar em turnos noturnos (escala de plantão).Disponibilidade para cobrir turnos de trabalho durante períodos de alta demanda e suporte técnico (escalas de plantão).Disponibilidade para trabalhar horas extras remuneradas, caso seja necessário resolver um problema técnico.Diferenciais: Experiência com frameworks de gerenciamento de incidentes.Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA.Familiaridade com segurança, compliance e auditoria em ambientes em nuvem.Entendimento de otimização de custos e engenharia de performance na AWS.Inglês *** Empresa de Tecnologia Contratação via cooperativa
-
Site Reliability Engineer
1 semana atrás
Belo Horizonte, Brasil MetaCTO Tempo inteiroAbout UsAt MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services. As a Site Reliability Engineer (SRE), you will play a critical role in ensuring the reliability, scalability, and security of the backend infrastructure that powers...
-
Site Reliability Engineer
Há 7 dias
Belo Horizonte, Brasil Review ALL Tempo inteiroAbout the Company This company operates a global computing platform that enables businesses to programmatically deploy single-tenant Bare Metal instances across multiple regions worldwide. They are a team of passionate engineers working at the intersection of hardware, software, and network infrastructure, building the fastest, most developer-centric...
-
Senior Site Reliability Engineer
Há 14 horas
Belo Horizonte, Brasil Canonical Tempo inteiroCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading public cloud and silicon providers, and...
-
Software Engineer Site Reliability Engineer
1 semana atrás
Belo Horizonte, Brasil Scubyt Tempo inteiroSoftware Engineer Site Reliability EngineerLocation: Brazil REMOTE Duration: Fulltime CLT / REMOTEAbout the roleThe Application SRE Team supports several critical components of our foundational technologies for real-time protection, as well as our RBI and SSPM services. We are a team of software engineers focused on improving availability, latency,...
-
Site Reliability Engineer
1 semana atrás
Belo Horizonte, Brasil MetaCTO Tempo inteiroAbout Us At MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services. As a Site Reliability Engineer (SRE) , you will play a critical role in ensuring the reliability, scalability, and security of the backend infrastructure that powers...
-
Site Reliability Engineer
Há 2 dias
Belo Horizonte, Brasil AgileEngine Tempo inteiroSite Reliability Engineer (Middle/Senior) ID38916 Join to apply for the Site Reliability Engineer (Middle/Senior) ID38916 role at AgileEngine AgileEngine is an Inc. 5000 company that creates award‑winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and...
-
Senior Site Reliability Engineer
Há 8 horas
Belo Horizonte, Minas Gerais, Brasil YAPP Tempo inteiro R$80.000 - R$120.000 por anoA Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que...
-
Senior Site Reliability
Há 2 dias
Belo Horizonte, Brasil Canonical Tempo inteiroSenior Site Reliability / Gitops Engineer Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our customers include the world's...
-
Site Reliability Engineer ID45689
Há 4 dias
Belo Horizonte, Brasil AgileEngine Tempo inteiroJoin to apply for the Site Reliability Engineer ID45689 role at AgileEngine . 3 days ago. Be among the first 25 applicants. Get AI-powered advice on this job and more exclusive features. AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in...
-
Site Reliability Engineer
Há 7 dias
Belo Horizonte, Brasil BairesDev Tempo inteiroSite Reliability Engineer - Remote Work | REF# We are looking for a Site Reliability Engineer to administrate and provide support for the whole project infrastructure hosted in the cloud while implementing CI/CD pipelines for the automation of the deployments. What You Will Do Ensure high service availability, performance, security, and maintainability....