Site Reliability Engineer

3 semanas atrás


Rio de Janeiro, Brasil Gauge Tempo inteiro

Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos. Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance.

Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua.

🚀 Buscamos um Engenheiro de Confiabilidade de Site (SRE) qualificado, com expertise em automação, observabilidade e foco estratégico em desempenho. Junte-se a nós para liderar iniciativas em gerenciamento de nuvem, automação de CI/CD e promover uma cultura de engenharia de confiabilidade. Se você prospera em um ambiente dinâmico e voltado para a tecnologia, esta pode ser sua próxima mudança de carreira #SRE #AWS #DevOps #Observabilidade #Escalabilidade 💻🔍

- Posição: SRE
- Horário: Comercial
- Modelo de atuação: Remoto

(SRE) – AWS | DevOps | Observabilidade | Escalabilidade

Resumo da Posição:

Buscamos um(a) Site Reliability Engineer (SRE) com forte atuação em ambientes AWS, automação de infraestrutura e foco estratégico em confiabilidade, escalabilidade e performance. Este profissional será responsável por garantir a resiliência de ambientes altamente distribuídos, com uso intensivo de soluções serverless e containers, além de liderar iniciativas de observabilidade, automação e melhoria contínua com base em métricas e indicadores de negócio.

Responsabilidades Principais:

Gestão Estratégica de Ambientes Cloud (AWS):

- Liderar a operação e evolução de ambientes complexos e altamente replicáveis na AWS, com foco em alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS, S3, entre outros.

Confiabilidade e Observabilidade:

- Implementar e evoluir práticas de observabilidade ponta a ponta, utilizando ferramentas como New Relic, CloudWatch e dashboards customizados, com foco em SLIs, SLOs e SLAs. Atuar proativamente na identificação de gargalos e incidentes, promovendo ações corretivas e preventivas.

Automação e Eficiência Operacional (CI/CD):

- Projetar e manter pipelines de CI/CD robustos e seguros com Jenkins, Bitbucket e GitOps, garantindo entregas contínuas e confiáveis de microserviços e workloads serverless.

Cultura de Engenharia de Confiabilidade:

- Promover práticas de engenharia de confiabilidade, como chaos engineering, postmortems, blameless culture e automação de tarefas operacionais, reduzindo o toil e aumentando a eficiência da equipe.

Segurança e Governança:

- Integrar práticas de DevSecOps ao ciclo de vida da aplicação, com foco em IAM, redes seguras, monitoramento de vulnerabilidades e conformidade com políticas de segurança.

Documentação e Disseminação de Conhecimento:

- Criar e manter documentação técnica clara e acessível sobre arquitetura, automações, incidentes e boas práticas, promovendo a autonomia e capacitação da equipe.

Habilidades Técnicas Desejadas:

Cloud AWS (Avançado):

- Profundo conhecimento em serviços AWS e infraestrutura como código (Terraform ou CloudFormation). Experiência com ambientes distribuídos, escaláveis e resilientes.

CI/CD e Automação:

- Experiência sólida com Jenkins, Bitbucket, GitOps e integração contínua de microserviços e aplicações serverless.

Observabilidade e Performance:

- Domínio de ferramentas como New Relic, CloudWatch, Prometheus ou similares. Capacidade de definir e acompanhar métricas de confiabilidade e desempenho.

Segurança em Nuvem:

- Práticas de segurança em ambientes cloud, com foco em IAM, redes privadas, criptografia e monitoramento contínuo.

Microserviços e Serverless:

- Experiência com arquitetura baseada em microserviços, containers (ECS) e funções serverless (Lambda), com foco em resiliência, escalabilidade e custo-benefício.

Certificações Recomendadas:

Obrigatória: AWS Certified Cloud Practitioner

Desejável: AWS Certified SysOps Administrator – Associate

Diferencial: Certificações em SRE, observabilidade ou segurança em nuvem

🥳 O que oferecemos :

• Vale Refeição/Vale Alimentação

• Assistência médica

• Assistência odontológica

• Day Off

• Gympass

• Auxílio Creche

• Assistência Pet

• Auxílio Combustível

• Auxílio Home Office

• Reembolso Educacional

• E-learning - Academia Stefanini com diversos cursos

• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.)

• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos

• Vantagens e descontos nos melhores estabelecimentos

• Programa de Formação de Líderes


  • Site Reliability Engineer

    4 semanas atrás


    Rio de Janeiro, Rio de Janeiro, Brasil BairesDev Tempo inteiro

    Overview Site Reliability Engineer at BairesDev. We are looking for a Site Reliability Engineer to build and maintain highly reliable, scalable, and secure OpenShift/Kubernetes clusters. You will approach the problem of building and maintaining production systems from a software engineering perspective with a focus on automation and reliability. What You...

  • Site Reliability

    3 semanas atrás


    Rio de Janeiro, Brasil Canonical Tempo inteiro

    Join to apply for the Site Reliability / Gitops Engineer role at Canonical 1 day ago Be among the first 25 applicants Join to apply for the Site Reliability / Gitops Engineer role at Canonical Get AI-powered advice on this job and more exclusive features. Canonical is a leading provider of open source software and operating systems to the global...

  • Site Reliability Engineer

    3 semanas atrás


    Rio de Janeiro, Brasil BairesDev Tempo inteiro

    OverviewSite Reliability Engineer at BairesDev. We are looking for a Site Reliability Engineer to build and maintain highly reliable, scalable, and secure OpenShift/Kubernetes clusters. You will approach the problem of building and maintaining production systems from a software engineering perspective with a focus on automation and reliability. What You Will...

  • Site Reliability Engineer

    4 semanas atrás


    Rio de Janeiro, Rio de Janeiro, Brasil buscojobs Brasil Tempo inteiro

    Conhecendo a TAG Somos uma empresa de tecnologia, uma Infraestrutura do Mercado Financeiro (IMF), autorizada e regulada pelo Banco Central. Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras. Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil. De...


  • Rio de Janeiro, Brasil Canonical Tempo inteiro

    Senior Site Reliability / Gitops EngineerJoin or sign in to find your next job Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Senior Site Reliability / Gitops Engineer1 day ago Be among the first 25 applicants Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Canonical is a leading provider...

  • Site Reliability Engineer

    3 semanas atrás


    Rio de Janeiro, Brasil AgileEngine Tempo inteiro

    OverviewSite Reliability Engineer (Middle) ID38916 at AgileEngine. Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine. AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development...

  • Site Reliability Engineer

    3 semanas atrás


    Rio de Janeiro, Brasil Canonical Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer role at Canonical Canonical is a leading provider of open source software and operating systems to the global enterprise and technology markets. Our platform, Ubuntu, is widely used in breakthrough enterprise initiatives such as public cloud, data science, AI, engineering innovation, and IoT. Our...

  • Senior Site Reliability

    3 semanas atrás


    Rio de Janeiro, Brasil Canonical Tempo inteiro

    Senior Site Reliability / Gitops EngineerJoin or sign in to find your next job Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Senior Site Reliability / Gitops Engineer1 day ago Be among the first 25 applicants Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Canonical is a leading...

  • Site Reliability

    2 semanas atrás


    Região Geográfica Imediata de Criciúma, Brasil Canonical Tempo inteiro

    Join to apply for the Site Reliability / Gitops Engineer role at Canonical 1 day ago Be among the first 25 applicants Join to apply for the Site Reliability / Gitops Engineer role at Canonical Get AI-powered advice on this job and more exclusive features. Canonical is a leading provider of open source software and operating systems to the global...


  • Rio de Janeiro, Brasil buscojobs Brasil Tempo inteiro

    Overview At INDI, we're passionate about empowering individuals and businesses worldwide. Our cutting-edge recruiters connect leading companies with top talent, fostering a dynamic environment where innovation thrives. Join us in shaping the future of work. Responsibilities 100% Home Office Handling major incidents via CIRS (Critical Issue Response...