Especialista em Sustentação e Resiliência de Serviços

4 semanas atrás


Brasil beBeeSRE Tempo inteiro
Chave para o Sucesso como Especialista em Sustentação e Resiliência de Serviços

Desenvolva habilidades profissionais excepcionais como Especialista em Sustentação e Resiliência de Serviços em uma plataforma inovadora que fornece soluções de Inteligência Artificial para diversas áreas. Contribua para a construção de soluções robustas e escaláveis.

Descrição do Cargo

Essa pessoa fará parte da equipe de sustentação e resiliência de serviços de uma plataforma líder em Inteligência Artificial, contribuindo para a entrega de soluções de alta qualidade e responsabilidade total.

Responsabilidades
  • Projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/FastAPI, garantindo segurança e observabilidade contínua.
  • Automatizar infraestrutura com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade flexível.
  • Criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.
  • Implementar e evoluir SLIs/SLOs; instrumentar serviços com Prometheus, Grafana, OpenTelemetry e rastreabilidade distribuída.
  • Monitorar, diagnosticar e otimizar bancos SQL (Postgres), caches (Redis) e bases vetoriais, focando em desempenho e custo eficiente.
  • Conduzir resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.
  • Capacitar o time: disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
  • Participar do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.
Habilidades e Experiência Necessárias
  • Experiência prática como SRE/DevOps em ambientes cloud (AWS, GCP ou Azure).
  • Domínio de Linux, redes, containers (Docker) e Kubernetes.
  • Proficiência em Infrastructure as Code (Terraform, Pulumi ou CloudFormation).
  • Rotinas de CI/CD com GitHub Actions, GitLab CI, Argo CD ou similares.
  • Instrumentação e alerta com Prometheus, Grafana, Loki/ELK, Alertmanager.
  • Programação/scripting em Python e Bash (Go é bônus).
  • Conhecimento de Postgres, Redis e tuning de performance.
  • Experiência em gestão de incidentes e elaboração de post-mortems.
  • Inglês técnico para leitura e escrita.
Diferencial
  • Conhecimento em infraestrutura em nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.
  • Experiência com Cloud Run, Knative ou FaaS.
  • Noções de cost optimisation em FinOps.
  • Contribuições open-source em projetos Cloud Native.
  • Experiência com ferramentas de monitoramento e observabilidade, como Prometheus e Grafana.
  • Familiaridade com pipelines de CI/CD.
  • Conhecimento em infraestrutura como código (IaC), como Terraform.
  • Experiência com agentes de IA, LLMs e RAG.
  • Conhecimento em protocolos de rede, como TCP/IP e.
  • Experiência com proxy reverso e balanceamento de carga.


  • Brasil beBeeSre Tempo inteiro

    Descrição do Cargo Nós estamos buscando um profissional experiente para ocupar o cargo de Especialista em Resiliência e Engenharia. Essa pessoa será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional. Missão do Cargo Como parte da nossa estrutura de Cloud e...

  • Especialista sre

    4 semanas atrás


    Brasil Sankhya Gestão De Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes Saa S, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...


  • Brasil CWI Software Tempo inteiro

    Profissional experiente com sólida experiência com engenharia de software e sustentação de sistemas críticos, com foco especial em ERPs financeiros e plataformas do mercado de investimentos. Especialista em identificar, analisar e resolver problemas complexos em ambientes de produção de alta disponibilidade, utilizando tecnologias Java, Mongo DB, AWS...

  • Especialista DevOps

    Há 23 horas


    Brasil Enacom Group Tempo inteiro

    Buscamos um(a) Especialista DevOps para atuar na sustentação e evolução da nossa infraestrutura de CI/CD, garantindo escalabilidade, segurança e automação dos ambientes em AWS e Azure DevOps. O profissional será responsável por apoiar squads de desenvolvimento, implementando boas práticas de integração e entrega contínua, observabilidade e...


  • Brasil Blue Fleet | SaaS Gestão Locadoras De Veículos Tempo inteiro

    Se você tem experiência com. NET C# , domínio em SQL Server e gosta de mergulhar na análise e resolução de problemas técnicos, essa oportunidade pode ser para você. O que você fará no dia a dia? Atuar no atendimento de chamados técnicos de nível 2 , em parceria com a equipe de suporte. Analisar, debugar e corrigir problemas em sistemas...

  • Especialista SRE

    4 semanas atrás


    Brasil Sankhya Gestão de Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...

  • Especialista sre

    3 semanas atrás


    Brasil Sankhya Gestão De Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes Saa S, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...


  • Brasil BDA Solutions - IA, RPA e Data Analytics Tempo inteiro

    A BDA Solutions, empresa especializada em Data & AI, está contratando um Analista de Dados com especialização na gestão e sustentação do ambiente da plataforma Tableau , atuando com foco em governança, qualidade e continuidade operacional dos dados na modalidade de contratação: PJ. O profissional será responsável por garantir a integridade,...


  • Brasil Sankhya Gestão De Negócios Tempo inteiro

    Procuramos um(a) Cloud Operations Engineer Pleno (AWS) para compor nosso time de Cloud e Operações. Esse profissional será peça-chave na sustentação, automação e evolução da nossa infraestrutura em nuvem, garantindo ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos Saa S. MISSÃ O: Como...


  • Brasil Sankhya Gestão De Negócios Tempo inteiro

    Procuramos um(a) Cloud Operations Engineer Sênior (AWS) para compor nosso time de Cloud e Operações. Esse profissional será peça-chave na sustentação, automação e evolução da nossa infraestrutura em nuvem, garantindo ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos Saa S. MISSÃ O: ...