Consultor Espacialista SRE

3 semanas atrás


Ipatinga MG, Brasil Kaspper Tempo inteiro

*Vaga: Consultor Espacialista SRE (Frelancer: Projeto Pontual com grande possibilidade de prorrogação)**Quem somos nós* Aqui na Kaspper, a gente leva tecnologia a sério, mas sem perder a leveza Somos uma empresa de tecnologia feita de pessoas incríveis, criando soluções personalizadas para que nossos clientes respirem tranquilidade. Há mais de 30 anos, entregamos projetos desafiadores para grandes empresas como Santander, Bayer, Banco do Nordeste, Whirlpool, Brinks, Mapfre, Safra, PwC, entre outras. Saiba mais: Projeto de Fábrica Período: novembro (freelancer) — Duração estimada: 4 semanas (prova de conceito) com possibilidade de contratação. Regime: 100% remoto *Missão da Função* Atuar como responsável pela confiabilidade, disponibilidade e desempenho da plataforma SaaS do cliente, realizando uma Prova de Conceito (PoC) que valide desempenho, disponibilidade, escalabilidade, segurança e resiliência, garantindo que os critérios de aceitação sejam atingidos. *O que a gente espera de você:* Ser comunicativo e colaborativo Ter autonomia para resolver problemas e buscar soluções Compartilhar conhecimento e ajudar a galera Topar entrar em reuniões com a câmera aberta (a gente gosta de ver quem tá do outro lado )️ *Principais Atividades (PoC — entregas técnicas)* Elaborar e validar diagramas L3 (fluxos, portas, protocolos, criptografia). Configurar e operar infraestrutura AWS multi-AZ com backup, RPO ≤ 1h e RTO ≤ 4h. Executar testes de carga e estresse (meta: 2000 sessões, p95 Medir TTO/MTTA, uptime, latência e disponibilidade (meta ≥ 99%). Simular incidentes (Crítico/Alta/Média/Baixa) e documentar timeline dos eventos. Realizar simulação de falha em AZ primária e DR com cutover controlado. Implementar autoscaling e HPA com métricas e histórico de eventos. Configurar observabilidade OpenMetrics compatível com Prometheus, Grafana, Jaeger, CloudWatch, AppDynamics. Criar dashboards de latência, filas, erros e disponibilidade. Executar backup e restauração com verificação de hashes. Orquestrar rollback automático em deploy com falha simulada. Produzir relatórios padronizados (Requisito, Evidência, Resultado, Data, Responsável). Montar e submeter playbook ITSM e RCA completo. *Stack e Ferramentas* AWS: EC2, EKS, CloudWatch, S3, RDS, Route 53, IAM Observabilidade: Prometheus, Grafana, Jaeger, OpenMetrics CI/CD: GitHub Actions, Jenkins ou GitLab CI Testes de carga: Locust, k6 ou JMeter Infra-as-code: Terraform ou AWS CDK ITSM: Integração com ServiceNow, Jira ou similar *Perfil Desejado* Experiência sólida como SRE ou DevOps Sênior. Capacidade de executar ponta a ponta: infra, observabilidade, testes e DR. Vivência com simulações de falha e cenários de resiliência em ambiente controlado. Raciocínio analítico e documentação técnica rigorosa. Entrega orientada a evidências e métricas. *Observações* Trabalho pontual (PoC), com possibilidade de extensão para operação contínua e homologação de ambiente. Projeto inicial de 4 semanas (novembro); possibilidade de contratação/continuidade conforme resultado da PoC. *Entregáveis Esperados (resumo)* PoC técnica completa com evidências de performance, disponibilidade e resiliência. Dashboards e relatórios padronizados. Playbook ITSM e RCA. Plano de ação para homologação/continuidade operacional. Se identificou com essa oportunidade? Então vem ser Kaspper vemprakaspper@kaspper.com