Site Reliability Engineer

2 semanas atrás


Salvador, Brasil Gauge Tempo inteiro

Somos uma empresa do Grupo Stefanini.
Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor.
Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos.
Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance.Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua.
Buscamos um Engenheiro de Confiabilidade de Site (SRE) qualificado, com expertise em automação, observabilidade e foco estratégico em desempenho.
Junte-se a nós para liderar iniciativas em gerenciamento de nuvem, automação de CI/CD e promover uma cultura de engenharia de confiabilidade.
Se você prospera em um ambiente dinâmico e voltado para a tecnologia, esta pode ser sua próxima mudança de carreira #SRE #AWS #DevOps #Observabilidade #Escalabilidade Posição: SREHorário: ComercialModelo de atuação: Remoto(SRE) – AWS | DevOps | Observabilidade | EscalabilidadeResumo da Posição:Buscamos um(a) Site Reliability Engineer (SRE) com forte atuação em ambientes AWS, automação de infraestrutura e foco estratégico em confiabilidade, escalabilidade e performance.
Este profissional será responsável por garantir a resiliência de ambientes altamente distribuídos, com uso intensivo de soluções serverless e containers, além de liderar iniciativas de observabilidade, automação e melhoria contínua com base em métricas e indicadores de negócio.Responsabilidades Principais:Gestão Estratégica de Ambientes Cloud (AWS):Liderar a operação e evolução de ambientes complexos e altamente replicáveis na AWS, com foco em alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS, S3, entre outros.Confiabilidade e Observabilidade:Implementar e evoluir práticas de observabilidade ponta a ponta, utilizando ferramentas como New Relic, CloudWatch e dashboards customizados, com foco em SLIs, SLOs e SLAs.
Atuar proativamente na identificação de gargalos e incidentes, promovendo ações corretivas e preventivas.Automação e Eficiência Operacional (CI/CD):Projetar e manter pipelines de CI/CD robustos e seguros com Jenkins, Bitbucket e GitOps, garantindo entregas contínuas e confiáveis de microserviços e workloads serverless.Cultura de Engenharia de Confiabilidade:Promover práticas de engenharia de confiabilidade, como chaos engineering, postmortems, blameless culture e automação de tarefas operacionais, reduzindo o toil e aumentando a eficiência da equipe.Segurança e Governança:Integrar práticas de DevSecOps ao ciclo de vida da aplicação, com foco em IAM, redes seguras, monitoramento de vulnerabilidades e conformidade com políticas de segurança.Documentação e Disseminação de Conhecimento:Criar e manter documentação técnica clara e acessível sobre arquitetura, automações, incidentes e boas práticas, promovendo a autonomia e capacitação da equipe.Habilidades Técnicas Desejadas:Cloud AWS (Avançado):Profundo conhecimento em serviços AWS e infraestrutura como código (Terraform ou CloudFormation).
Experiência com ambientes distribuídos, escaláveis e resilientes.CI/CD e Automação:Experiência sólida com Jenkins, Bitbucket, GitOps e integração contínua de microserviços e aplicações serverless.Observabilidade e Performance:Domínio de ferramentas como New Relic, CloudWatch, Prometheus ou similares.
Capacidade de definir e acompanhar métricas de confiabilidade e desempenho.Segurança em Nuvem:Práticas de segurança em ambientes cloud, com foco em IAM, redes privadas, criptografia e monitoramento contínuo.Microserviços e Serverless:Experiência com arquitetura baseada em microserviços, containers (ECS) e funções serverless (Lambda), com foco em resiliência, escalabilidade e custo-benefício.Certificações Recomendadas:Obrigatória: AWS Certified Cloud PractitionerDesejável: AWS Certified SysOps Administrator – AssociateDiferencial: Certificações em SRE, observabilidade ou segurança em nuvem O que oferecemos :• Vale Refeição/Vale Alimentação• Assistência médica• Assistência odontológica• Day Off• Gympass• Auxílio Creche• Assistência Pet• Auxílio Combustível• Auxílio Home Office• Reembolso Educacional• E-learning - Academia Stefanini com diversos cursos• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.)• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos• Vantagens e descontos nos melhores estabelecimentos• Programa de Formação de Líderes


  • Site Reliability Engineer

    2 semanas atrás


    Salvador, Brasil Wex Brazil Technology Services Tempo inteiro

    About the Team/Role We are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business.This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems.The ideal candidate will have...


  • Salvador, Brasil AgileEngine Tempo inteiro

    OverviewSite Reliability Engineer (Middle) ID38916 AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us multiple Best Place to Work awards. If...


  • Salvador, Brasil AgileEngine Tempo inteiro

    Overview Site Reliability Engineer (Middle) ID38916 AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us multiple Best Place to Work awards. If you're...

  • Site Reliability Engineer

    3 semanas atrás


    Salvador, Brasil AgileEngine Tempo inteiro

    OverviewJoin to apply for the Site Reliability Engineer (Middle) ID38916 role at AgileEngine. AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us...

  • Site Reliability Engineer

    2 semanas atrás


    Salvador, Brasil buscojobs Brasil Tempo inteiro

    Sobre a Empresa Com mais de 20 anos de mercado, a ITeam se destaca pelo comprometimento com o cliente. Baseamos nosso relacionamento em valores sólidos e objetivos claros, oferecendo soluções e serviços de TI que auxiliam na realização das metas dos nossos clientes. Nossa missão é fornecer serviços de TI que se alinhem com a estratégia e processos...

  • Site Reliability Engineer

    2 semanas atrás


    Salvador, Brasil HCLTech Tempo inteiro

    Your role and responsabilities: - Handling major incidents via CIRS (Critical Issue Response System) and providing frequent updates until resolution. - Performing deep-dive application troubleshooting and identifying preventive actions. - Managing CIRS-related requests including deployments, feature toggles, and data fixes. - Following up on major...

  • .NET Engineer

    Há 7 dias


    Salvador, Brasil AgileEngine Tempo inteiro

    Join to apply for the .NET Engineer (Senior/Lead) ID41557 role at AgileEngine AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and startups across 17+ industries. We rank among the leaders in application development and AI/ML, and our people-first culture has earned us Best Place to Work awards. ABOUT THE ROLE ...

  • Senior Golang Engineer

    2 semanas atrás


    Salvador, Brasil Valor Software Tempo inteiro

    OverviewValor Software is a software development and consulting company that leverages open-source technologies to drive innovation and business growth for its clients.We are looking for a Senior GoLang Engineer to join Valor as we continue to expand.Senior GoLang Engineer — you will join an exciting project focused on building a platform for short video...

  • Senior Data Engineer

    3 semanas atrás


    Salvador, Bahia, Brasil Pride Global Tempo inteiro

    We're Hiring: Senior Data Engineer (MLOps) | Remote from Brazil | Fluent English required | USD-Hourly payLocation: Remote – Brazil only Language: Fluent English requiredAre you passionate about building scalable data platforms and cutting-edge MLOps solutions? Do you want to work with a top-tier US company revolutionizing e-commerce and circular...

  • .Net Engineer

    Há 6 dias


    Salvador, Brasil Agileengine Tempo inteiro

    Join to apply for the .NET Engineer (Senior/Lead) ID41557 role at AgileEngineAgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and startups across 17+ industries.We rank among the leaders in application development and AI/ML, and our people-first culture has earned us Best Place to Work awards.ABOUT THE ROLEAs a...