Especialista Sre Senior

Há 13 horas


Belo Horizonte, Brasil Bebeedesenvolvedor Tempo inteiro

Descrição do CargoO especialista II SRE fará parte do time de SRE de uma plataforma que disponibiliza serviços de inteligência artificial para diversas áreas e possibilita o desenvolvimento de soluções de agentes de IA integrados a produtos Totvs.Aqui estão as responsabilidades do cargo:Projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/FASTAPI, garantindo resiliência, segurança e observabilidade de ponta a ponta.Automatizar infraestrutura (IAC) com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade sob demanda.Criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.Implementar e evoluir SLIs/SLOs; instrumentar serviços com Prometheus, Grafana, OpenTelemetry e rastreabilidade distribuída.Monitorar, diagnosticar e otimizar bancos SQL (Postgres), caches (Redis) e bases vetoriais, focando em desempenho e custo.Conduzir resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.Capacitar o time: disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.Participar do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.RequisitosExperiência prática como SRE/DevOps em ambientes cloud (AWS, GCP ou Azure).
Domínio de Linux, redes, containers (Docker) e Kubernetes.Proficiência em Infrastructure as Code (Terraform, Pulumi ou CloudFormation).
Rotinas de CI/CD com GitHub Actions, GitLab CI, Argo CD ou similares.Instrumentação e alerta com Prometheus, Grafana, Loki/ELK, Alertmanager.Programação/scripting em Python e Bash (Go é bônus).
Conhecimento de Postgres, Redis e tuning de performance.Experiência em gestão de incidentes e elaboração de post-mortems.Inglês técnico para leitura e escrita.BenefíciosÉ um diferencial ter:Conhecimento em infraestrutura em nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.Experiência com Cloud Run, Knative ou Faas.Noções de cost optimisation em FinOps.Contribuições open-source em projetos cloud native.Experiência com ferramentas de monitoramento e observabilidade, como Prometheus e Grafana.Familiaridade com pipelines de CI/CD.Conhecimento em infraestrutura como código (IaC), como Terraform.Experiência com agentes de IA, LLMS e RAG.Conhecimento em protocolos de rede, como TCP/IP e HTTP.Experiência com proxy reverso e balanceamento de carga.


  • Especialista Sre

    1 semana atrás


    Belo Horizonte, Brasil Sankhya Gestão de Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...

  • Especialista Sre Devops

    2 semanas atrás


    Belo Horizonte, Brasil Sysmanager Tempo inteiro

    VAGA ABERTA:Especialista SRE DevOps Sênior– RemotoEm busca de uma carreira em uma empresa que valoriza a flexibilidade, desenvolvimento pessoal e sucesso da equipe? Com 28 anos de experiência e reconhecidos pelo GPTW pelo quinto ano consecutivo, estamos em busca de talentos para se juntarem a nós comoEspecialista SRE DevOps. Com matriz no Brasil e...

  • Especialista Sre

    1 semana atrás


    Belo Horizonte, Brasil Caderno Nacional Tempo inteiro

    Especialista SRE - Detalhes da Vaga. ? Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. ? Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua missão será assegurar que nossos sistemas estejam sempre disponíveis,...

  • Especialista Sre

    1 semana atrás


    Belo Horizonte, Brasil Caderno Nacional Tempo inteiro

    Especialista Sre - Detalhes da Vaga. ? Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. ?Missão do cargoComo parte da nossa estrutura de Cloud e SRE, sua missão será assegurar que nossos sistemas estejam sempre disponíveis,...

  • Especialista Sre

    1 semana atrás


    Belo Horizonte, Brasil Sankhya Gestão de Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...

  • Especialista Sre

    1 semana atrás


    Belo Horizonte, Brasil Sankhya Gestão De Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala.Missão do cargoComo parte da nossa estrutura de Cloud e SRE, sua...

  • Especialista Sre

    Há 3 dias


    Belo Horizonte, Brasil Sankhya Gestão De Negócios Tempo inteiro

    Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala.Missão do cargoComo parte da nossa estrutura de Cloud e SRE, sua...


  • Belo Horizonte, Brasil Yapp Tempo inteiro

    A Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que...


  • Belo Horizonte, Brasil Sankhya Gestão De Negócios Tempo inteiro

    Procuramos um(a) Cloud Operations Engineer Sênior (AWS) para compor nosso time de Cloud e Operações.Esse profissional será peça-chave na sustentação, automação e evolução da nossa infraestrutura em nuvem, garantindo ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos SaaS.MISSÃO: Como parte...


  • Belo Horizonte, Brasil Yapp Tempo inteiro

    VAGA EXCLUSIVA PARA PCDA Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa...