Site Reliability Engineer

2 semanas atrás


Brasil Gauge Tempo inteiro

Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos. Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance.

Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua.

Buscamos um Engenheiro de Confiabilidade de Site (SRE) qualificado, com expertise em automação, observabilidade e foco estratégico em desempenho. Junte-se a nós para liderar iniciativas em gerenciamento de nuvem, automação de CI/CD e promover uma cultura de engenharia de confiabilidade. Se você prospera em um ambiente dinâmico e voltado para a tecnologia, esta pode ser sua próxima mudança de carreira #SRE #AWS #DevOps #Observabilidade #Escalabilidade

  • Posição: SRE
  • Modelo de atuação: Remoto

(SRE) – AWS | DevOps | Observabilidade | Escalabilidade

Resumo da Posição:

Buscamos um(a) Site Reliability Engineer (SRE) com forte atuação em ambientes AWS, automação de infraestrutura e foco estratégico em confiabilidade, escalabilidade e performance. Este profissional será responsável por garantir a resiliência de ambientes altamente distribuídos, com uso intensivo de soluções serverless e containers, além de liderar iniciativas de observabilidade, automação e melhoria contínua com base em métricas e indicadores de negócio.

Responsabilidades Principais:

Gestão Estratégica de Ambientes Cloud (AWS):

  • Liderar a operação e evolução de ambientes complexos e altamente replicáveis na AWS, com foco em alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS, S3, entre outros.

Confiabilidade e Observabilidade:

  • Implementar e evoluir práticas de observabilidade ponta a ponta, utilizando ferramentas como New Relic, CloudWatch e dashboards customizados, com foco em SLIs, SLOs e SLAs. Atuar proativamente na identificação de gargalos e incidentes, promovendo ações corretivas e preventivas.

Automação e Eficiência Operacional (CI/CD):

  • Projetar e manter pipelines de CI/CD robustos e seguros com Jenkins, Bitbucket e GitOps, garantindo entregas contínuas e confiáveis de microserviços e workloads serverless.

Cultura de Engenharia de Confiabilidade:

  • Promover práticas de engenharia de confiabilidade, como chaos engineering, postmortems, blameless culture e automação de tarefas operacionais, reduzindo o toil e aumentando a eficiência da equipe.
  • Integrar práticas de DevSecOps ao ciclo de vida da aplicação, com foco em IAM, redes seguras, monitoramento de vulnerabilidades e conformidade com políticas de segurança.

Documentação e Disseminação de Conhecimento:

  • Criar e manter documentação técnica clara e acessível sobre arquitetura, automações, incidentes e boas práticas, promovendo a autonomia e capacitação da equipe.

Habilidades Técnicas Desejadas:

  • Profundo conhecimento em serviços AWS e infraestrutura como código (Terraform ou CloudFormation). Experiência com ambientes distribuídos, escaláveis e resilientes.

CI/CD e Automação:

  • Experiência sólida com Jenkins, Bitbucket, GitOps e integração contínua de microserviços e aplicações serverless.

Observabilidade e Performance:

  • Domínio de ferramentas como New Relic, CloudWatch, Prometheus ou similares. Capacidade de definir e acompanhar métricas de confiabilidade e desempenho.

Segurança em Nuvem:

  • Práticas de segurança em ambientes cloud, com foco em IAM, redes privadas, criptografia e monitoramento contínuo.

Microserviços e Serverless:

  • Experiência com arquitetura baseada em microserviços, containers (ECS) e funções serverless (Lambda), com foco em resiliência, escalabilidade e custo-benefício.

Certificações Recomendadas:

Diferencial: Certificações em SRE, observabilidade ou segurança em nuvem

O que oferecemos :


• Vale Refeição/Vale Alimentação


• Assistência médica


• Assistência odontológica


• Auxílio Creche


• Assistência Pet


• Auxílio Combustível


• Auxílio Home Office


• E-learning - Academia Stefanini com diversos cursos


• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.)


• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos


• Vantagens e descontos nos melhores estabelecimentos


• Programa de Formação de Líderes

Não encontrou uma vaga? Cadastre-se aquiNão encontrou sua vaga? Cadastre-se aqui Banco de Talentos - ValinhosQuer ser um Ninja? Cadastre-se no nosso Banco de Talentos Não encontrou sua vaga? Inscreva-se em nosso Banco de Talentos para Pessoas Autistas Processo Seletivo - : Engenheiro(a) DevOpsSite Reliability Engineer (SRE) – 100% Remoto (Times de Tecnologia - Brasil inteiro) #J-18808-Ljbffr

  • Brasil Aubay Portugal Tempo inteiro

    Aubay Portugal is a multinational French company, in Portugal since 2007. We have offices in Lisbon and Oporto and we are a specialized consultant in Management, Implementation, Development and Maintenance of Information Systems. We have more than 150 active partners and we operate in sectors such as banking, insurance, telecommunications, services, energy...


  • Brasil Seedify Tempo inteiro US$90.000 - US$120.000 por ano

    Seedify is a leading cryptocurrency launchpad platform dedicated to fostering innovation and success in the Web3 space. Our mission is to identify and assist promising teams and projects and offer outstanding returns to our investor base.Job DescriptionWe are seeking a highly skilled Site Reliability Engineer with extensive experience in DevOps,...


  • Brasil Housecall Pro Tempo inteiro

    Join to apply for the Senior DevOps Site Reliability Engineer role at Housecall Pro Join to apply for the Senior DevOps Site Reliability Engineer role at Housecall Pro Get AI-powered advice on this job and more exclusive features. TO BE CONSIDERED FOR THIS ROLE, PLEASE SUBMIT AN UPDATED RESUME TRANSLATED TO ENGLISH Who is Housecall Pro? Housecall Pro is...


  • Brasil Articul8 AI Tempo inteiro

    Senior Site Reliability Engineer (SRE) - (Brazil)Senior Site Reliability Engineer (SRE) - (Brazil)2 weeks ago Be among the first 25 applicants Get AI-powered advice on this job and more exclusive features. About Us Articul8 AI is at the forefront of Generative AI innovation, delivering cutting-edge SaaS products that transform how businesses operate. Our...


  • Brasil beBeeEngineering Tempo inteiro €60.000 - €90.000

    Aubay Portugal is a multinational French company operating in sectors such as banking, insurance, telecommunications, services, energy and transports. About the JobWe are looking for a skilled Site Reliability Engineer with experience in Azure Cloud and Kubernetes to join our team.4 years of experience as a Site Reliability Engineer;Experience with Azure...

  • Site Reliability Engineer

    4 semanas atrás


    Brasil Parfin Tempo inteiro

    About ParfinParfin is the leading web3 infrastructure provider in Latin America. We offer institutions an end-to-end solution for digital asset custody, trading, tokenization, and management. Our clients include some of the largest banks and crypto-native companies in Latin America. We accelerate institutional adoption of web3 by creating solutions that...

  • site reliability engineer

    2 semanas atrás


    Brasil Bernoulli Educação Tempo inteiro

    Join to apply for the SITE RELIABILITY ENGINEER role at Bernoulli Educação Join to apply for the SITE RELIABILITY ENGINEER role at Bernoulli Educação Se o olho brilha, vem ser Bernoulli Somos feitos de pessoas que acreditam no poder transformador da educação. Gente criativa, determinada e que gosta de aprender. Profissionais que enxergam os...

  • Site Reliability Engineer

    2 semanas atrás


    Brasil Pythian Tempo inteiro

    Site Reliability Engineer Multiple timezones available |Remote | Work from Home Why Pythian: At Pythian, we are experts in strategic database and analytics services, driving digital transformation and operational excellence. Pythian, a multinational company, was founded in 1997 and started by ensuring the reliability and performance of mission-critical...

  • Site Reliability Engineer

    4 semanas atrás


    Brasil The Pythian Group Tempo inteiro

    Site Reliability EngineerEurope | Multiple Timezones | Remote | Work from HomeWhy Pythian:At Pythian, we are experts in strategic database and analytics services, driving digital transformation and operational excellence. Pythian, a multinational company, was founded in 1997 and started by ensuring the reliability and performance of mission-critical...


  • Brasil DuckDuckGo Tempo inteiro

    6 days ago Be among the first 25 applicants Get AI-powered advice on this job and more exclusive features. Who We Are Hi, we're DuckDuckGo, the online protection company and remote-first team of 300+ on a mission to raise the standard of trust online. Founded in 2008 and profitable since 2014, our annual revenue now exceeds $100 million USD. Millions use our...