Site reliability engineer

Há 5 dias

UBERLANDIA, Brasil Grupo Real Tempo inteiro

Experiência Sênior de mínimo de 5 anos de experiência consolidada em funções de SRE, DevOps ou Engenharia de Infraestrutura em ambientes de alta escala e missão crítica. Domínio prático e teórico de múltiplos serviços AWS e de arquitetura cloud-native. Desejável certificação AWS relevante (ex: Solutions Architect Professional ou DevOps Engineer Professional) é um grande diferencial. Sólido conhecimento de protocolos de rede (TCP/IP, HTTP, DNS), topologias de rede em Cloud e troubleshooting de conectividade complexa. Proficiência na implementação de políticas de segurança (IAM, Least Privilege), proteção de perímetro (WAF, Security Groups, NACLs) e gerenciamento de segredos (Secrets Management). Experiência com Terraform ou cloudformation. Experiência prática com Kubernetes (EKS, Kops) e Docker. DIFERENCIAIS:Experiência com SRE leader Engineering. Conhecimento em Compliance e Frameworks de Segurança (ex: ISO 27001, PCI-DSS). Experiência em ambientes Serverless (AWS Lambda) e arquitetura Event-Driven. Vivência com administração de bancos de dados relacionais e NoSQL de grande escala. Definir e monitorar SLIs/SLOs (Service Level Indicators/Objectives) e garantir que a infraestrutura e os serviços atendam aos níveis de serviço acordados. Implementar e evoluir soluções de Observabilidade (Métricas, Logs e Tracing) utilizando ferramentas como Grafana, Datadog ou ELK Stack. Prover liderança técnica no design, implementação e manutenção de arquiteturas AWS altamente disponíveis, escaláveis e eficientes, utilizando serviços como VPC, EC2, ECS/EKS, S3, RDS, Lambda, CloudFront, entre outros. Projetar e automatizar o provisionamento e gerenciamento da infraestrutura utilizando Terraform ou CloudFormation, com foco em práticas de GitOps. Dominar a arquitetura de rede em Cloud, incluindo a configuração avançada de VPC, Subnets, Gateways, Load Balancers (ALB/NLB), Roteamento e Interconectividade (VPN/Direct Connect, ZTNA), garantindo a performance e a resiliência da comunicação. Integrar e automatizar práticas de segurança (SecOps) em toda a infraestrutura e pipelines. Atuar com proficiência em serviços de segurança da AWS (IAM, Security Groups, WAF, KMS, GuardDuty) e implementar políticas de controle de acesso, criptografia e auditoria. Liderar a resposta a incidentes críticos, atuando no troubleshooting complexo, e conduzir análises de causa raiz (Post-Mortems Blameless) para prevenir reincidências. Projetar, implementar e manter pipelines de CI/CD robustos e seguros (ex: Jenkins, GitLab CI, GitHub Actions) para entregas contínuas e confiáveis.

Américas

Europa

Ásia / Oceania

África

Site reliability engineer