Engenheiro sre devops pleno

4 semanas atrás


HOME OFFICE, Brasil Grupo Taking Tempo inteiro

Estamos em busca de um(a) Site Reliability Engineer (SRE) experiente para atuar como referência técnica em confiabilidade, desempenho e escalabilidade de ambientes distribuídos em produção. O profissional será responsável por desenhar soluções resilientes, promover automações e garantir observabilidade, atuando de forma colaborativa com equipes multidisciplinares e ambientes multicloud (GCP, AWS e Azure).

Responsabilidades da Vaga:
  • Atuar como referência técnica em práticas de SRE: observabilidade, automação, capacidade e resposta a incidentes.

  • Projetar e manter pipelines de CI/CD com Azure DevOps.

  • Automatizar o provisionamento e gerenciamento de infraestrutura com Terraform e Rundeck.

  • Desenvolver e sustentar sistemas distribuídos com alta disponibilidade.

  • Implementar soluções com Machine Learning (ML) e Inteligência Artificial (IA).

  • Administrar e escalar ambientes Kubernetes em GKE (GCP) e AKS (Azure), com GitOps (ArgoCD).

  • Monitorar serviços e sistemas com Prometheus, Grafana, Zabbix e Dynatrace.

  • Criar integrações assíncronas e resilientes com RabbitMQ e CloudSQL.

  • Aplicar boas práticas de arquitetura e segurança em GCP, AWS e Azure, com foco em performance e otimização de custos.

  • Definir, implementar e monitorar SLIs, SLOs e SLAs em parceria com stakeholders.

  • Executar postmortems e liderar ações de melhoria contínua em confiabilidade.

Requisitos da Vaga:.

Cloud Platforms:

  • GCP: GKE, Cloud Functions, Pub/Sub, VPCs, IAM, Stackdriver.

  • AWS: EC2, IAM, CloudWatch, VPC, S3.

  • Azure: App Services, Data Factory, VNets, Storage, Azure Monitor.

Containers & Orquestração:

  • Docker, Kubernetes, Rancher.

IaC (Infraestrutura como Código):

  • Terraform, Ansible, Puppet.

CI/CD & GitOps:

  • Azure DevOps, GitLab CI, Jenkins, ArgoCD, FluxCD.

Mensageria:

  • RabbitMQ.

Observabilidade:

  • Prometheus, Grafana, Zabbix, Elastic Stack (ELK).

Sistemas Distribuídos:

  • Arquitetura orientada a eventos, APIs REST, microsserviços.

Programação & Scripting:

  • Shell Script, Python.

Versionamento e Colaboração:

  • Git, GitLab, GitHub.

Segurança:

  • RBAC, SonarQube, IAM Policies, mTLS, gerenciamento de secrets.

Soft Skills:
  • Capacidade analítica e visão crítica de confiabilidade.

  • Comunicação clara e eficaz com times técnicos.

  • Mentalidade DevOps com foco em automação e melhoria contínua.

  • Visão orientada à Disponibilidade de Negócio.

  • Proatividade, senso de dono e foco em resolução de problemas.

  • Organização e autonomia em ambientes ágeis e distribuídos.

  • Cultura de aprendizado contínuo.

Diferenciais Desejáveis
    • Google Professional Cloud Architect.

    • AWS Solutions Architect.

    • Microsoft Azure Architect.

    • CKA / CKAD (Kubernetes).

  • Conhecimentos em:

    • Chaos Engineering.

    • Service Mesh (Istio, Linkerd).

    • Estratégias Multicloud com Alta Disponibilidade.

    • Participação ativa em war rooms e postmortems blameless.

    • Bancos de dados NoSQL e escaláveis: MongoDB, Redis, Bigtable.


  • Sre

    4 semanas atrás


    HOME OFFICE, Brasil Ninecon Tempo inteiro

    Site Reliability Engineer (SRE) Estamos em busca de um(a) SRE para integrar nosso time de desenvolvimento. Atuamos com uma arquitetura moderna baseada em Node.js e valorizamos a manutenção de sistemas confiáveis, escaláveis e observáveis. Principais responsabilidades: Automação de processos de deploy, monitoramento e recuperação de falhas; ...

  • Sre pleno

    4 semanas atrás


    HOME OFFICE, Brasil Grupo Taking Tempo inteiro

    SRE - Pleno Foco em Observabilidade Requisitos e Qualificações:Experiência com sistemas operacionais Linux e Windows, incluindo administração e otimização Sólidos conhecimentos em redes de computadores (protocolos, segurança, configuração) Vivência com ferramentas como Kubernetes, Docker, RedHat Satellite, Microsoft WSUS e System Center ...

  • Tech lead sre

    4 semanas atrás


    HOME OFFICE, Brasil RPE Tempo inteiro

    Sólido conhecimento em observabilidade (Prometheus, Grafana, Datadog, OpenTelemetry, Zabbix e ELK). Experiência com CI/CD, automação de infraestrutura (Terraform, Ansible, etc.). Conhecimentos avançados em Linux, redes, containers (Docker, Kubernetes). Programação e scripting: Python, Go, Shell ou equivalente. Experiência com arquitetura de...

  • Engenheiro cloud

    4 semanas atrás


    HOME OFFICE, Brasil ICON Solutions do Brasil Tempo inteiro

    Engenheiro Cloud / DevOps - Especialista (Remoto) Você conhece a Icon? Apaixonados por pessoas e especialistas em tecnologia. Nosso trabalho é encontrar talentos e soluções sob medida para os nossos clientes. Vem encontrar o seu projeto ideal conosco e participar da comunidade ICON Sobre a Vaga Código da vaga: A39221617328Modelo de contratação: PJ...

  • Analista sre pleno

    4 semanas atrás


    HOME OFFICE, Brasil Vivo Digital Tempo inteiro

    Ter conhecimento na operação de aplicações baseadas em Weblogic Application, SOA Suite, OSB, Apache, OHS; Diferencial ter conhecimento na operação de aplicações baseadas em KubernetsOpenshiftMicroserviços; Diferencial também conhecimento e operação de Axway Api Gateway; Conhecimentos básicos em suporte em aplicações em nuvem, banco de dados...


  • HOME OFFICE, Brasil Magazine Luiza Tempo inteiro

    Sobre nós O grupo aiq. é formado pela holding aiqfome e coligadas GrandChef, Plus Delivery e Tonolucro; todas elas juntas são responsáveis por fazer a vertical food da magalu voar Somos a primeira e a maior plataforma de delivery online para restaurantes 100% brasileira, levando tecnologia e a melhor experiência em entrega pra todo o BrasilE para...

  • Tech lead devops

    4 semanas atrás


    HOME OFFICE, Brasil Celero Tempo inteiro

    Buscamos um(a) Tech Lead DevOps para atuar na vanguarda da nossa equipe de DevOps, impulsionando a excelência técnica e a eficiência da nossa infraestrutura em nuvem.  Você será fundamental na concepção, evolução e manutenção de ambientes robustos baseados em Kubernetes (GKE), garantindo escalabilidade, confiabilidade e segurança de ponta a...

  • Devops

    4 semanas atrás


    HOME OFFICE, Brasil Pix Force Tempo inteiro

    Atividades: Automatizar processos de provisionamento, monitoramento e deployment; Manter e evoluir pipelines de CI/CD; Gerenciar infraestrutura como código (IaC) com ferramentas como Terraform ou Ansible; Monitorar sistemas, atuar na resolução de incidentes e garantir alta disponibilidade dos ambientes; Trabalhar em parceria com os times de...

  • Site reliability engineer

    4 semanas atrás


    HOME OFFICE, Brasil Solutis Tempo inteiro

     SRE Pleno Na Solutis, estamos em busca de um(a) Site Reliability Engineer (SRE) Pleno com paixão por confiabilidade, automação e ambientes de alta performance. Se você curte desafios técnicos, cultura DevOps e quer atuar em um projeto de grande escala, essa oportunidade é pra você Responsabilidades: Garantir a confiabilidade, escalabilidade e...

  • Engenheiro(a) cloud e devops

    4 semanas atrás


    HOME OFFICE, Brasil Mutant Tempo inteiro

    Microsoft Azure: Experiência em projetar, implementar e gerenciar ambientes (servidores, redes, BDs, autoescalabilidade). CI/CD e Automação: Domínio de Azure DevOps (YAML), Git, e automação de processos de deploy, build e testes. Infraestrutura como Código (IaC): Experiência com Terraform, Bicep, ARM Templates ou Ansible. Contêineres e...