Site Reliability Engineer

Há 2 dias


Brasília, Brasil Gauge Tempo inteiro
Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos. Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance. Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua.
Buscamos um Engenheiro de Confiabilidade de Site (SRE) qualificado, com expertise em automação, observabilidade e foco estratégico em desempenho. Junte-se a nós para liderar iniciativas em gerenciamento de nuvem, automação de CI/CD e promover uma cultura de engenharia de confiabilidade. Se você prospera em um ambiente dinâmico e voltado para a tecnologia, esta pode ser sua próxima mudança de carreira #SRE #AWS #DevOps #Observabilidade #Escalabilidade
Posição: SRE
Horário: Comercial
Modelo de atuação: Remoto
(SRE) – AWS | DevOps | Observabilidade | Escalabilidade
Resumo da Posição:
Buscamos um(a) Site Reliability Engineer (SRE) com forte atuação em ambientes AWS, automação de infraestrutura e foco estratégico em confiabilidade, escalabilidade e performance. Este profissional será responsável por garantir a resiliência de ambientes altamente distribuídos, com uso intensivo de soluções serverless e containers, além de liderar iniciativas de observabilidade, automação e melhoria contínua com base em métricas e indicadores de negócio.
Responsabilidades Principais:
Gestão Estratégica de Ambientes Cloud (AWS):
Liderar a operação e evolução de ambientes complexos e altamente replicáveis na AWS, com foco em alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS, S3, entre outros.
Confiabilidade e Observabilidade:
Implementar e evoluir práticas de observabilidade ponta a ponta, utilizando ferramentas como New Relic, CloudWatch e dashboards customizados, com foco em SLIs, SLOs e SLAs. Atuar proativamente na identificação de gargalos e incidentes, promovendo ações corretivas e preventivas.
Automação e Eficiência Operacional (CI/CD):
Projetar e manter pipelines de CI/CD robustos e seguros com Jenkins, Bitbucket e GitOps, garantindo entregas contínuas e confiáveis de microserviços e workloads serverless.
Cultura de Engenharia de Confiabilidade:
Promover práticas de engenharia de confiabilidade, como chaos engineering, postmortems, blameless culture e automação de tarefas operacionais, reduzindo o toil e aumentando a eficiência da equipe.
Segurança e Governança:
Integrar práticas de DevSecOps ao ciclo de vida da aplicação, com foco em IAM, redes seguras, monitoramento de vulnerabilidades e conformidade com políticas de segurança.
Documentação e Disseminação de Conhecimento:
Criar e manter documentação técnica clara e acessível sobre arquitetura, automações, incidentes e boas práticas, promovendo a autonomia e capacitação da equipe.
Habilidades Técnicas Desejadas:
Cloud AWS (Avançado):
Profundo conhecimento em serviços AWS e infraestrutura como código (Terraform ou CloudFormation). Experiência com ambientes distribuídos, escaláveis e resilientes.
CI/CD e Automação:
Experiência sólida com Jenkins, Bitbucket, GitOps e integração contínua de microserviços e aplicações serverless.
Observabilidade e Performance:
Domínio de ferramentas como New Relic, CloudWatch, Prometheus ou similares. Capacidade de definir e acompanhar métricas de confiabilidade e desempenho.
Segurança em Nuvem:
Práticas de segurança em ambientes cloud, com foco em IAM, redes privadas, criptografia e monitoramento contínuo.
Microserviços e Serverless:
Experiência com arquitetura baseada em microserviços, containers (ECS) e funções serverless (Lambda), com foco em resiliência, escalabilidade e custo-benefício.
Certificações Recomendadas:
Obrigatória: AWS Certified Cloud Practitioner
Desejável: AWS Certified SysOps Administrator – Associate
Diferencial: Certificações em SRE, observabilidade ou segurança em nuvem
O que oferecemos :
• Vale Refeição/Vale Alimentação
• Assistência médica
• Assistência odontológica
• Day Off
• Gympass
• Auxílio Creche
• Assistência Pet
• Auxílio Combustível
• Auxílio Home Office
• Reembolso Educacional
• E-learning - Academia Stefanini com diversos cursos
• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.)
• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos
• Vantagens e descontos nos melhores estabelecimentos
• Programa de Formação de Líderes

  • Brasília, Brasil Canonical Tempo inteiro

    Senior Site Reliability / Gitops Engineer Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Senior Site Reliability / Gitops Engineer 1 day ago Be among the first 25 applicants Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Get AI-powered advice on this job and more exclusive features....


  • Brasília, Brasil Gauge Tempo inteiro

    Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a...

  • Site Reliability Engineer

    2 semanas atrás


    Brasília, Distrito Federal, Brasil Aubay Portugal Tempo inteiro US$80.000 - US$120.000 por ano

    Aubay Portugal is a multinational French company, in Portugal since 2007. We have offices in Lisbon and Oporto and we are a specialized consultant in Management, Implementation, Development and Maintenance of Information Systems. We have more than 150 active partners and we operate in sectors such as banking, insurance, telecommunications, services, energy...


  • Brasília, Brasil AgileEngine Tempo inteiro

    OverviewSite Reliability Engineer (Middle) ID38916 – Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine. AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML,...


  • Brasília, Brasil AgileEngine Tempo inteiro

    Overview Site Reliability Engineer (Middle) ID38916 – Join to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine. AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML,...


  • Brasília, Brasil Aubay Portugal Tempo inteiro

    Aubay Portugal is a multinational French company, in Portugal since 2007. We have offices in Lisbon and Oporto and we are a specialized consultant in Management, Implementation, Development and Maintenance of Information Systems. We have more than 150 active partners and we operate in sectors such as banking, insurance, telecommunications, services, energy...


  • Brasília, Brasil Aubay Portugal Tempo inteiro

    Aubay Portugal is a multinational French company, in Portugal since 2007. We have offices in Lisbon and Oporto and we are a specialized consultant in Management, Implementation, Development and Maintenance of Information Systems. We have more than 150 active partners and we operate in sectors such as banking, insurance, telecommunications, services, energy...


  • Brasília, Brasil Aubay Portugal Tempo inteiro

    Aubay Portugal is a multinational French company, in Portugal since 2007. We have offices in Lisbon and Oporto and we are a specialized consultant in Management, Implementation, Development and Maintenance of Information Systems. We have more than 150 active partners and we operate in sectors such as banking, insurance, telecommunications, services, energy...


  • Brasília, Distrito Federal, Brasil Bebeereliability Tempo inteiro

    Job Title: Site Reliability EngineerAre you a skilled professional seeking a challenging and dynamic work environment?Our company is a multinational corporation specializing in the Management, Implementation, Development and Maintenance of Information Systems.We are looking for an experienced System Reliability Expert to join our team.With over 150 active...


  • Brasília, Brasil buscojobs Brasil Tempo inteiro

    Overview Junte-se à nossa equipe de SRE e seja fundamental para garantir a confiabilidade, escalabilidade e segurança dos ambientes em nuvem dos nossos clientes. Você será responsável por configurar e gerenciar a esteira CI / CD, o ambiente on-cloud e os componentes arquiteturais, garantindo a entrega de soluções robustas e de alto desempenho. ...