SRE pleno
1 semana atrás
como pessoa engenheira de sre pleno, sua missão será projetar, construir e manter a infraestrutura escalável, resiliente e segura que sustenta nosso marketplace. você aplicará princípios de engenharia de software para resolver problemas operacionais complexos, automatizando processos para eliminar o trabalho manual (toil), definindo e monitorando service level objectives (slos) para garantir uma experiência de usuário excepcional e evoluindo nossa plataforma para suportar o crescimento acelerado do negócio.
Responsabilidades e atribuições
engenharia de confiabilidade e performance:
- desenvolver e implementar soluções para garantir que os sistemas atinjam os slos de disponibilidade e latência, conduzindo análises de capacidade (capacity planning) para picos de tráfego.
- projetar e implementar arquiteturas resilientes, utilizando padrões como redundância, failover automático e degradação graciosa.
- realizar análises de performance e otimização de custos (finops), identificando gargalos e propondo soluções eficientes.
automação e evolução da plataforma:
- automatizar o provisionamento e gerenciamento da infraestrutura aws utilizando infraestrutura como código (iac) com terraform, garantindo ambientes consistentes.
- implementar e evoluir práticas de gitops (com github actions ou aws codepipeline) para gerenciar o ciclo de vida de aplicações em ecs e kubernetes de forma declarativa e segura.
- desenvolver ferramentas internas e scripts (python) para automatizar tarefas operacionais e reduzir o toil.
observabilidade avançada:
- implementar e gerenciar uma stack de observabilidade completa, incluindo métricas (prometheus, datadog), logs (graylog, opensearch) e tracing distribuído (opentelemetry).
- criar dashboards e alertas significativos que relacionam métricas técnicas com indicadores de negócio.
- utilizar dados de tracing distribuído para diagnosticar problemas de latência e erros em transações complexas que atravessam múltiplos microsserviços.
resposta a incidentes e aprendizado contínuo:
- participar do rodízio de on-call, atuando na triagem, mitigação e resolução de incidentes.
- conduzir post-mortems após incidentes, focando na identificação de causas-raiz sistêmicas e na criação de planos de ação.
- manter e aprimorar a documentação de sistemas e os playbooks de resposta a incidentes.
segurança integrada (devsecops):
- integrar ferramentas de análise de segurança (sast, container scanning) nos pipelines de ci/cd.
- automatizar a aplicação de políticas de segurança na infraestrutura como código e nas configurações de kubernetes (security-as-code).
- acompanhar o ciclo de vida de segredos e credenciais de forma segura (hashicorp vault, aws secrets manager).
mentoria e colaboração:
- atuar como um consultor de confiabilidade para as equipes de desenvolvimento, participando de revisões de design de arquitetura.
- compartilhar conhecimento e melhores práticas de sre, atuando como mentor para engenheiros de nível júnior.
Requisitos e qualificações
competências essenciais (experiência sólida esperada)
- aws: ecs, eks,, s3, rds, iam, vpc. iac: terraform ou pulumi. sistemas operacionais: linux e shell script.
- containers: docker. orquestração: kubernetes (helm). ci/cd: jenkins, github actions, aws codepipelinei.
- métricas e logs: datadog, prometheus/grafana, graylog, opensearch. linguagens de scripting: python ou golang.
- princípios de segurança: redes, iam, hardening. gerenciamento de segredos: hashicorp vault, aws secrets manager.
- mensageria: kafka, sqs/sns. bancos de dados: nosql e relacionais.
perfil comportamental
- proatividade: você não apenas resolve problemas, mas busca ativamente por oportunidades de melhoria sistêmica, analisando tendências de alertas e propondo projetos de automação.
- colaboração e comunicação eficaz: você atua como uma ponte entre as equipes de desenvolvimento e operações, utilizando dados (slos, métricas) para embasar suas argumentações.
- mentalidade de engenharia de sistemas: você aborda problemas operacionais com a mentalidade de um engenheiro de software, buscando soluções de código que resolvam classes de problemas de forma definitiva.
- resiliência e foco em aprendizado: você encara incidentes como oportunidades de aprendizado e é um defensor da cultura de post-mortems.
Informações adicionais
- modelo remoto e regime CLT (40hrs semanais);
- vale transporte;
- plano de saúde (amil coparticipação para você e seus dependentes) e odontológico (amil);
- vale-refeição ou alimentação depositado em cartão flexível (sem desconto, inclusive nas férias);
- auxílio home office depositado em cartão flexível (sem desconto);
- seguro de vida;
- saúde física - Totalpass: plataforma que te dá acesso a diversas academias no Brasil;
- saúde mental - Clude Saúde: parceria com plataforma que contém diversos especialistas para você cuidar da sua saúde mental e garantir mais qualidade de vida;
- auxílio creche/babá para filhos de 0 a 5 anos;
- licença parental (não gestante 30 dias. gestante 180 dias - jornada de 6 horas até o bebê completar 1 ano);
- convênio com o sesc;
- folga corre: que tal uma folga semestral para fazer os "corre da vida"?;
- petlove: (plano empresarial para o bem-estar dos seus bichinhos;
- prata da casa: desconto nos produtos do enjoei pra ficar no estilo.
o grupo enjoei é um ecossistema de marcas guiadas por criatividade e inovação. inauguramos na web como um blog em 2009 e, desde então, nos tornamos a principal plataforma de moda segunda mão do brasil. hoje, reunimos o enjoei, o elo7 e o cresci e perdi, conectando milhões de pessoas a outros milhões de produtos.
temos um ambiente leve e cheio de oportunidade pra quem quer crescer junto com a gente. se você topa um desafio e acredita na força da comunidade, pode vir
-
Desenvolvedor(a) Pleno SRE
Há 7 dias
Remoto, Brasil Magazine Luiza Tempo inteiro R$40.000 - R$60.000 por anoVocê curte resolver problemas complexos, automatizar processos manuais e deixar sistemas mais estáveis e eficientes? Então essa vaga é pra vocêEstamos montando um time de SRE dentro da Tribo de Plataforma & Full do Magalu Entregas, com o propósito de aumentar a confiabilidade, disponibilidade e automação das nossas plataformas que sustentam o...
-
Analista Infraestrutura Pleno
2 semanas atrás
Remoto, Brasil Magazine Luiza Tempo inteiro R$80.000 - R$120.000 por anoA Magalu Cloud é a plataforma de serviços de computação em nuvem criada pela maior e mais inovadora empresa de varejo do país, a Magazine Luiza. Nascemos em 2020, com o propósito claro: Impulsionar a competitividade do Brasil através da tecnologia. Oferecemos serviços de nuvem hyperscale com engenharia local, interface descomplicada, preços em reais...
-
Site Reliability Engineer Pleno
2 semanas atrás
Remoto, Brasil PremierSoft Tempo inteiro R$96.000 - R$120.000 por anoNa Premiersoft, transformamos desafios em soluções. Com mais de uma década de pioneirismo em desenvolvimento mobile, somos movidos por um propósito claro: criar experiências tecnológicas que impulsionam o crescimento e a transformação dos nossos clientes. Nosso time, formado por mais de 200 #Heroes, combina expertise técnica com o nosso DNA: Team...
-
Cloud SRE Sr
1 semana atrás
Remoto, Brasil Ci&T Tempo inteiro R$80.000 - R$120.000 por anoSomos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 7.400 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1.000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.Importante: se você reside na Região Metropolitana de...
-
Analista de SRE SR
2 semanas atrás
Remoto, Brasil Ipiranga Tempo inteiro R$80.000 - R$120.000 por anoJá pensou em trabalhar na Ipiranga?Na Ipiranga acreditamos que pessoas com brilho nos olhos, autênticas e engajadas são nosso diferencial competitivo Atuamos com paixão e propósito, colocando o cliente no centro das nossas decisões. Valorizamos a autonomia, a abertura e a transparência, pois temos certo de que a verdade e o respeito fortalecem...
-
Desenvolvedor(a) Backend Pleno
Há 3 dias
Remoto, Brasil Magazine Luiza Tempo inteiro R$90.000 - R$120.000 por anoSobre nósO Magalu é uma das maiores empresas de varejo do Brasil, reconhecida por sua inovação e presença digital. O time de tecnologia do Magalu é formado por profissionais inovadores e apaixonados por transformar o varejo digital. Com foco em soluções ágeis e escaláveis, desenvolvem projetos que impactam milhões de clientes. Em um ambiente...
-
Scrum Master Sênior
2 semanas atrás
Remoto, Brasil Extractta Tempo inteiro R$60.000 - R$120.000 por anoEstamos em busca de profissionais de desenvolvimento de software com perfil sênior, que tenham paixão por tecnologia, visão de produto e foco em entregar soluções de alto impacto.Buscamos pessoas que tenham autonomia, senso crítico e estejam sempre em movimento — acompanhando tendências, propondo melhorias e contribuindo para a evolução contínua...
-
Brasil - Remoto Remoto Tempo inteiro R$80.000 - R$120.000 por anoEstamos à procura de DBRE (Database Reliability Engineer) para nos ajudar a construir, manter e desenvolver os nossos Produtos.Portanto, se você é apaixonado por Tecnologia, Banco de Dados, Confiabilidade, Infraestrutura como código (IaC), esta posição é para você.Você está pronto para novos desafios? Seus desafios para fazer a diferença neste...
-
Desenvolvedor Backend Java Sênior
2 semanas atrás
Remoto, Brasil Extractta Tempo inteiro R$10.000 - R$50.000 por anoEstamos em busca de profissionais de desenvolvimento de software com perfil sênior, que tenham paixão por tecnologia, visão de produto e foco em entregar soluções de alto impacto.Buscamos pessoas que tenham autonomia, senso crítico e estejam sempre em movimento — acompanhando tendências, propondo melhorias e contribuindo para a evolução contínua...