
Especialista em Sustentação e Resiliência de Serviços
4 semanas atrás
Desenvolva habilidades profissionais excepcionais como Especialista em Sustentação e Resiliência de Serviços em uma plataforma inovadora que fornece soluções de Inteligência Artificial para diversas áreas. Contribua para a construção de soluções robustas e escaláveis.
Descrição do CargoEssa pessoa fará parte da equipe de sustentação e resiliência de serviços de uma plataforma líder em Inteligência Artificial, contribuindo para a entrega de soluções de alta qualidade e responsabilidade total.
Responsabilidades- Projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/FastAPI, garantindo segurança e observabilidade contínua.
- Automatizar infraestrutura com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade flexível.
- Criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.
- Implementar e evoluir SLIs/SLOs; instrumentar serviços com Prometheus, Grafana, OpenTelemetry e rastreabilidade distribuída.
- Monitorar, diagnosticar e otimizar bancos SQL (Postgres), caches (Redis) e bases vetoriais, focando em desempenho e custo eficiente.
- Conduzir resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.
- Capacitar o time: disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
- Participar do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.
- Experiência prática como SRE/DevOps em ambientes cloud (AWS, GCP ou Azure).
- Domínio de Linux, redes, containers (Docker) e Kubernetes.
- Proficiência em Infrastructure as Code (Terraform, Pulumi ou CloudFormation).
- Rotinas de CI/CD com GitHub Actions, GitLab CI, Argo CD ou similares.
- Instrumentação e alerta com Prometheus, Grafana, Loki/ELK, Alertmanager.
- Programação/scripting em Python e Bash (Go é bônus).
- Conhecimento de Postgres, Redis e tuning de performance.
- Experiência em gestão de incidentes e elaboração de post-mortems.
- Inglês técnico para leitura e escrita.
- Conhecimento em infraestrutura em nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.
- Experiência com Cloud Run, Knative ou FaaS.
- Noções de cost optimisation em FinOps.
- Contribuições open-source em projetos Cloud Native.
- Experiência com ferramentas de monitoramento e observabilidade, como Prometheus e Grafana.
- Familiaridade com pipelines de CI/CD.
- Conhecimento em infraestrutura como código (IaC), como Terraform.
- Experiência com agentes de IA, LLMs e RAG.
- Conhecimento em protocolos de rede, como TCP/IP e.
- Experiência com proxy reverso e balanceamento de carga.
-
Especialista em Resiliência e Engenharia
4 semanas atrás
Brasil beBeeSre Tempo inteiroDescrição do Cargo Nós estamos buscando um profissional experiente para ocupar o cargo de Especialista em Resiliência e Engenharia. Essa pessoa será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional. Missão do Cargo Como parte da nossa estrutura de Cloud e...
-
Especialista sre
4 semanas atrás
Brasil Sankhya Gestão De Negócios Tempo inteiroEstamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes Saa S, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...
-
Desenvolvedor(a) java sustentação
3 semanas atrás
Brasil CWI Software Tempo inteiroProfissional experiente com sólida experiência com engenharia de software e sustentação de sistemas críticos, com foco especial em ERPs financeiros e plataformas do mercado de investimentos. Especialista em identificar, analisar e resolver problemas complexos em ambientes de produção de alta disponibilidade, utilizando tecnologias Java, Mongo DB, AWS...
-
Especialista DevOps
Há 23 horas
Brasil Enacom Group Tempo inteiroBuscamos um(a) Especialista DevOps para atuar na sustentação e evolução da nossa infraestrutura de CI/CD, garantindo escalabilidade, segurança e automação dos ambientes em AWS e Azure DevOps. O profissional será responsável por apoiar squads de desenvolvimento, implementando boas práticas de integração e entrega contínua, observabilidade e...
-
Analista de sustentação c#
Há 2 dias
Brasil Blue Fleet | SaaS Gestão Locadoras De Veículos Tempo inteiroSe você tem experiência com. NET C# , domínio em SQL Server e gosta de mergulhar na análise e resolução de problemas técnicos, essa oportunidade pode ser para você. O que você fará no dia a dia? Atuar no atendimento de chamados técnicos de nível 2 , em parceria com a equipe de suporte. Analisar, debugar e corrigir problemas em sistemas...
-
Especialista SRE
4 semanas atrás
Brasil Sankhya Gestão de Negócios Tempo inteiroEstamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...
-
Especialista sre
3 semanas atrás
Brasil Sankhya Gestão De Negócios Tempo inteiroEstamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes Saa S, promovendo automação e excelência operacional em escala. Missão do cargo Como parte da nossa estrutura de Cloud e SRE, sua...
-
Brasil BDA Solutions - IA, RPA e Data Analytics Tempo inteiroA BDA Solutions, empresa especializada em Data & AI, está contratando um Analista de Dados com especialização na gestão e sustentação do ambiente da plataforma Tableau , atuando com foco em governança, qualidade e continuidade operacional dos dados na modalidade de contratação: PJ. O profissional será responsável por garantir a integridade,...
-
Cloud operations engineer pleno
4 semanas atrás
Brasil Sankhya Gestão De Negócios Tempo inteiroProcuramos um(a) Cloud Operations Engineer Pleno (AWS) para compor nosso time de Cloud e Operações. Esse profissional será peça-chave na sustentação, automação e evolução da nossa infraestrutura em nuvem, garantindo ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos Saa S. MISSÃ O: Como...
-
Cloud operations engineer sênior
3 semanas atrás
Brasil Sankhya Gestão De Negócios Tempo inteiroProcuramos um(a) Cloud Operations Engineer Sênior (AWS) para compor nosso time de Cloud e Operações. Esse profissional será peça-chave na sustentação, automação e evolução da nossa infraestrutura em nuvem, garantindo ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos Saa S. MISSÃ O: ...