Senior Site Reliability Engineer
2 semanas atrás
A Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que processa milhões de requisições diárias. Se está em busca deste desafio, vem ser GetrakerPrincipais responsabilidades:Definir, implementar e monitorar SLIs/SLOs de disponibilidade, latência e confiabilidade.Projetar e otimizar pipelines de CI/CD para microsserviços em ambiente de alta disponibilidade.Administrar e evoluir infraestruturas em AWS (EC2, ECS/EKS, S3, RDS, CloudFront, VPC, IAM, CloudWatch etc.).Gerenciar bancos distribuídos e sistemas críticos: Astra DB / Cassandra (DataStax), Redis e RabbitMQ.Automatizar provisionamento, configuração e escalabilidade com Terraform, Ansible ou similares.Desenvolver e manter práticas de observabilidade (métricas, logs, tracing) usando DataDog e ferramentas correlatas.Liderar investigações em incidentes críticos, propondo soluções definitivas (blameless postmortems).Atuar em otimização de custos em nuvem, equilibrando confiabilidade e budget.Garantir a segurança e conformidade da infraestrutura, com políticas de acesso, backup e auditoria contínua.Colaborar com times de engenharia e produto, trazendo visão de confiabilidade para o ciclo de desenvolvimento.Requisitos técnicos:6+ anos de experiência em SRE/DevOps em ambientes de alta escala e missão crítica.Domínio de AWS e arquitetura cloud-native.Conhecimento avançado em Cassandra (Astra DB / DataStax), Redis e RabbitMQ.Experiência com microsserviços e conteinerização (Docker, Kubernetes, ECS/EKS).Forte experiência em automação (Terraform, Ansible, etc.).Vivência com observabilidade e DataDog (métricas, logs e tracing).Sólido entendimento de redes, segurança e protocolos.Experiência com incident response e resolução de problemas complexos.Atuação em ambientes ágeis, com cultura DevOps/SRE.Diferenciais • Experiência em ambientes SaaS B2B de grande volume de dados. • Certificações relevantes (AWS, Kubernetes, DevOps, SRE). • Conhecimento especializado em GitHub Actions. • Experiência com arquiteturas serverless (AWS Lambda) e event-driven. • Histórico em migração e otimização de bancos distribuídos e infraestrutura em nuvem.Perfil comportamental:Proatividade;Facilidade em se comunicar;Ser uma pessoa que trabalhe em equipe, com comprometimento e responsabilidade.Local de trabalho: Belo Horizonte, MG Regime de contratação de tipo: Efetivo – CLT Jornada: Período Integral Nível hierárquico: Especialista
-
Site Reliability Engineer
4 semanas atrás
Belo Horizonte, Brasil MetaCTO Tempo inteiroAbout UsAt MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services. As a Site Reliability Engineer (SRE), you will play a critical role in ensuring the reliability, scalability, and security of the backend infrastructure that powers...
-
Site Reliability Engineer
4 semanas atrás
Belo Horizonte, Brasil Review ALL Tempo inteiroAbout the Company This company operates a global computing platform that enables businesses to programmatically deploy single-tenant Bare Metal instances across multiple regions worldwide. They are a team of passionate engineers working at the intersection of hardware, software, and network infrastructure, building the fastest, most developer-centric...
-
Senior Site Reliability Engineer
3 semanas atrás
Belo Horizonte, Brasil Canonical Tempo inteiroCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading public cloud and silicon providers, and...
-
Software Engineer Site Reliability Engineer
4 semanas atrás
Belo Horizonte, Brasil Scubyt Tempo inteiroSoftware Engineer Site Reliability EngineerLocation: Brazil REMOTE Duration: Fulltime CLT / REMOTEAbout the roleThe Application SRE Team supports several critical components of our foundational technologies for real-time protection, as well as our RBI and SSPM services. We are a team of software engineers focused on improving availability, latency,...
-
Site Reliability Engineer
4 semanas atrás
Belo Horizonte, Brasil MetaCTO Tempo inteiroAbout Us At MetaCTO, we specialize in helping startups and growing companies turn visionary ideas into successful digital products through expert app development and fractional CTO services. As a Site Reliability Engineer (SRE) , you will play a critical role in ensuring the reliability, scalability, and security of the backend infrastructure that powers...
-
Site Reliability Engineer
1 semana atrás
Belo Horizonte, Brasil Nearsure Tempo inteiroOverview Site Reliability Engineer - Work from home NearSure, a Nortal company, seeks a Senior Site Reliability Engineer to design, implement, and maintain reliable, repeatable, and performant infrastructure with focus on public cloud (primarily AWS). You will collaborate with product and platform engineering teams to enable deployments into this...
-
Senior Site Reliability Engineer
Há 3 dias
Belo Horizonte, Brasil Canonical Tempo inteiroSenior Site Reliability Engineer Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading public...
-
Senior Site Reliability Engineer
Há 24 horas
Belo Horizonte, Brasil Canonical Tempo inteiroSenior Site Reliability EngineerCanonical is a leading provider of open source software and operating systems to the global enterprise and technology markets.Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT.Our customers include the world's leading public cloud...
-
Site Reliability Engineer
3 semanas atrás
Belo Horizonte, Brasil AgileEngine Tempo inteiroSite Reliability Engineer (Middle/Senior) ID38916 Join to apply for the Site Reliability Engineer (Middle/Senior) ID38916 role at AgileEngine AgileEngine is an Inc. 5000 company that creates award‑winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and...
-
Site Reliability Engineer
1 semana atrás
Belo Horizonte, Brasil Conquest One Tempo inteiroVaga: SRE Sênior Híbrido – presencial 2x na semana no Jardim Paulista (Av. Nove de Julho – São Paulo/SP) + 3x na semana de home office Contratação: CLT Horário de trabalho: 09:00 às 18:00 Estamos em busca de um(a) Site Reliability Engineer Sênior para atuar de forma estratégica na transformação e evolução de nossas plataformas!Se você tem...