Site Reliability Engineer

1 semana atrás


Belo Horizonte, Brasil Gauge Tempo inteiro

Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos. Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance.

Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua.

Buscamos um Engenheiro de Confiabilidade de Site (SRE) qualificado, com expertise em automação, observabilidade e foco estratégico em desempenho. Junte-se a nós para liderar iniciativas em gerenciamento de nuvem, automação de CI/CD e promover uma cultura de engenharia de confiabilidade. Se você prospera em um ambiente dinâmico e voltado para a tecnologia, esta pode ser sua próxima mudança de carreira #SRE #AWS #DevOps #Observabilidade #Escalabilidade

  • Posição: SRE
  • Modelo de atuação: Remoto

(SRE) – AWS | DevOps | Observabilidade | Escalabilidade

Resumo da Posição:

Buscamos um(a) Site Reliability Engineer (SRE) com forte atuação em ambientes AWS, automação de infraestrutura e foco estratégico em confiabilidade, escalabilidade e performance. Este profissional será responsável por garantir a resiliência de ambientes altamente distribuídos, com uso intensivo de soluções serverless e containers, além de liderar iniciativas de observabilidade, automação e melhoria contínua com base em métricas e indicadores de negócio.

Responsabilidades Principais:

Gestão Estratégica de Ambientes Cloud (AWS):

  • Liderar a operação e evolução de ambientes complexos e altamente replicáveis na AWS, com foco em alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS, S3, entre outros.

Confiabilidade e Observabilidade:

  • Implementar e evoluir práticas de observabilidade ponta a ponta, utilizando ferramentas como New Relic, CloudWatch e dashboards customizados, com foco em SLIs, SLOs e SLAs. Atuar proativamente na identificação de gargalos e incidentes, promovendo ações corretivas e preventivas.

Automação e Eficiência Operacional (CI/CD):

  • Projetar e manter pipelines de CI/CD robustos e seguros com Jenkins, Bitbucket e GitOps, garantindo entregas contínuas e confiáveis de microserviços e workloads serverless.

Cultura de Engenharia de Confiabilidade:

  • Promover práticas de engenharia de confiabilidade, como chaos engineering, postmortems, blameless culture e automação de tarefas operacionais, reduzindo o toil e aumentando a eficiência da equipe.
  • Integrar práticas de DevSecOps ao ciclo de vida da aplicação, com foco em IAM, redes seguras, monitoramento de vulnerabilidades e conformidade com políticas de segurança.

Documentação e Disseminação de Conhecimento:

  • Criar e manter documentação técnica clara e acessível sobre arquitetura, automações, incidentes e boas práticas, promovendo a autonomia e capacitação da equipe.

Habilidades Técnicas Desejadas:

  • Profundo conhecimento em serviços AWS e infraestrutura como código (Terraform ou CloudFormation). Experiência com ambientes distribuídos, escaláveis e resilientes.

CI/CD e Automação:

  • Experiência sólida com Jenkins, Bitbucket, GitOps e integração contínua de microserviços e aplicações serverless.

Observabilidade e Performance:

  • Domínio de ferramentas como New Relic, CloudWatch, Prometheus ou similares. Capacidade de definir e acompanhar métricas de confiabilidade e desempenho.

Segurança em Nuvem:

  • Práticas de segurança em ambientes cloud, com foco em IAM, redes privadas, criptografia e monitoramento contínuo.

Microserviços e Serverless:

  • Experiência com arquitetura baseada em microserviços, containers (ECS) e funções serverless (Lambda), com foco em resiliência, escalabilidade e custo-benefício.

Certificações Recomendadas:

Diferencial: Certificações em SRE, observabilidade ou segurança em nuvem

O que oferecemos :

• Vale Refeição/Vale Alimentação

• Assistência médica

• Assistência odontológica

• Auxílio Creche

• Assistência Pet

• Auxílio Combustível

• Auxílio Home Office

• E-learning - Academia Stefanini com diversos cursos

• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.)

• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos

• Vantagens e descontos nos melhores estabelecimentos

• Programa de Formação de Líderes

Não encontrou uma vaga? Cadastre-se aqui Não encontrou sua vaga? Cadastre-se aqui Banco de Talentos - Valinhos Quer ser um Ninja? Cadastre-se no nosso Banco de Talentos ️ Não encontrou sua vaga? Inscreva-se em nosso Banco de Talentos para Pessoas Autistas ️ Processo Seletivo - : Engenheiro(a) DevOps Site Reliability Engineer (SRE) – 100% Remoto (Times de Tecnologia - Brasil inteiro) #J-18808-Ljbffr
  • Site Reliability Engineer

    4 semanas atrás


    Belo Horizonte, Minas Gerais, Brasil AgileEngine Tempo inteiro

    Site Reliability Engineer (Middle) ID38916 Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine Site Reliability Engineer (Middle) ID38916 3 weeks ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine Get AI-powered advice on this job and more exclusive...


  • Belo Horizonte, Brasil Bairesdev Tempo inteiro

    OverviewAt BairesDev, we've been leading technology projects for over 15 years.We deliver cutting-edge solutions to giants like Google and to startups in Silicon Valley.Our 4,000+ remote team includes top tech talent, and we offer roles that drive significant impact worldwide.This position is for a Site Reliability Engineer to build and maintain highly...


  • Belo Horizonte, Brasil Canonical Tempo inteiro

    Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading public cloud and silicon providers, and...


  • Belo Horizonte, Minas Gerais, Brasil Canonical Tempo inteiro

    Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading public cloud and silicon providers, and...

  • Site Reliability Engineer

    3 semanas atrás


    Belo Horizonte, Minas Gerais, Brasil Canonical Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our...

  • Site Reliability Engineer

    1 semana atrás


    Belo Horizonte, Brasil Canonical Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our...

  • Site Reliability Engineer

    1 semana atrás


    Belo Horizonte, Brasil Canonical Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our...


  • Belo Horizonte, Minas Gerais, Brasil Canonical Tempo inteiro

    Senior Site Reliability Engineer Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is very widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation and IoT. Our customers include the world's leading...

  • Site Reliability Engineer

    3 semanas atrás


    Belo Horizonte, Minas Gerais, Brasil AgileEngine Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine . AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us...

  • Site Reliability Engineer

    1 semana atrás


    Belo Horizonte, Brasil AgileEngine Tempo inteiro

    OverviewJoin to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine . AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us...