Site Reliability Engineer

3 semanas atrás


Barueri, Brasil Huge Networks Tempo inteiro

A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina.


Estamos em busca de um(a) Site Reliability Engineer (SRE) com experiência em arquiteturas Cloud, como CloudStack/OpenStack e CEPH, para atuar na sustentação, automação e confiabilidade da nossa infraestrutura.


Procuramos alguém mão na massa, com visão sistêmica e capacidade analítica para evoluir continuamente a operação. Se você tem paixão por redes/tecnologia, gosta de resolver problemas, e quer atuar em uma empresa dinâmica, jovem e inovadora, essa oportunidade é para você.



🔎 Responsabilidades


  • Garantir a confiabilidade, disponibilidade e performance dos sistemas e serviços críticos.
  • Administrar e evoluir nossa infraestrutura baseada em CloudStack/OpenStack.
  • Gerenciar e manter clusters de Ceph (RBD, CephFS, Object Gateway).
  • Desenvolver e aplicar automação de rotinas (IaC, pipelines de CI/CD).
  • Monitorar métricas, logs e alertas, propondo melhorias contínuas.
  • Apoiar times internos em incidentes críticos, realizando troubleshooting avançado.
  • Documentar processos, playbooks e boas práticas para aumentar a eficiência operacional.
  • Colaborar no planejamento da evolução da arquitetura e definição de SLAs/SLIs/SLOs.


✅ Requisitos Essenciais (Must to Have)


  • Experiência comprovada com AWS (EC2, S3, IAM, RDS, VPC, WAF, CloudWatch).
  • Vivência com micro-serviços e ambientes isolados.
  • Experiência com CloudStack e/ou OpenStack.
  • Vivência em administração de storages CEPH e similares (RBD, CephFS, Object Gateway).
  • Domínio de Linux (administração, troubleshooting, otimização).
  • Conhecimento em Infraestrutura como Código (Terraform, Ansible).
  • Experiência com containers e orquestração (Docker, Kubernetes).
  • Conhecimentos em redes e segurança (roteamento, VLANs, firewalls, VPNs).
  • Vivência com ferramentas de monitoramento e observabilidade (Zabbix, Prometheus, Grafana, ELK).
  • Habilidade em análise de incidentes e automação de correções.



🌟 Diferenciais (Nice to Have)


  • Formação em: Segurança da Informação, Engenharia da computação, Ciência da computação, Sistemas de informação ou qualquer área da computação ou correlatas como Engenharias de comunicação, infraestrutura, etc.
  • Experiência em ambientes críticos e de alta disponibilidade (telecom, ISPs, cloud providers).
  • Conhecimentos em protocolos de rede (BGP, OSPF).
  • Habilidade em scripting (Python, Bash, Go).
  • Vivência em ambientes multi-tenant.
  • Noções de FinOps para otimização de custos.


🕐 Detalhes da vaga

  • Modelo de contratação: PJ.
  • Presencial, com possibilidade futura de atuação híbrida, mediante avaliação de desempenho.
  • Durante o período de treinamento: horário comercial.
  • Horário de trabalho flexível (flexível mesmo).
  • Bônus financeiro por aniversário e tempo de empresa

  • Site Reliability Engineer

    3 semanas atrás


    Barueri, Brasil Ryz Labs Tempo inteiro

    Join to apply for the Site Reliability Engineer role at Ryz Labs 1 week ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer role at Ryz Labs Get AI-powered advice on this job and more exclusive features. Remote position within South AmericaRYZ is seeking a Site Reliability Engineer to join one of our clients, who is...

  • Site Reliability Engineer

    3 semanas atrás


    Barueri, Brasil Huge Networks Tempo inteiro

    A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...


  • Barueri, Brasil Huge Networks Tempo inteiro

    A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...


  • Barueri, Brasil Digiage Tempo inteiro

    Analista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer) Buscamos Analista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer). Requisitos Experiência prática com Datadog (APM, logs, métricas, traces e monitors). Vivência em observabilidade e SRE (Site Reliability Engineering). Experiência em configuração de...

  • Site reliability engineer

    3 semanas atrás


    Barueri, Brasil Huge Networks Tempo inteiro

    A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade . Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) ...

  • Site Reliability Engineer

    4 semanas atrás


    Barueri, São Paulo, Brasil Huge Networks Tempo inteiro

    A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade . Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...

  • Site Reliability Engineer

    3 semanas atrás


    Barueri, Estado de São Paulo, Brasil Huge Networks Tempo inteiro

    A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina.Estamos em busca de um(a) Site...


  • Barueri, São Paulo, Brasil Digiage Tempo inteiro R$90.000 - R$120.000 por ano

    Buscamos Analista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer) RequisitosExperiência prática com Datadog (APM, logs, métricas, traces e monitors).Vivência em observabilidade e SRE (Site Reliability Engineering).Experiência em configuração de retention filters, ingestão e indexação de logs.Vivência com cloud (AWS, Azure,...


  • Barueri, Brasil Markem-Imaje Tempo inteiro

    Join to apply for the Software Application Support Engineer role at Markem-Imaje 10 hours ago Be among the first 25 applicants Join to apply for the Software Application Support Engineer role at Markem-Imaje Markem-Imaje is a trusted world manufacturer of product identification and traceability solutions, offering a full line of reliable and innovative...

  • Ubuntu Security Engineer

    3 semanas atrás


    Barueri, Brasil Canonical Tempo inteiro

    Join to apply for the Ubuntu Security Engineer role at Canonical 3 days ago Be among the first 25 applicants Join to apply for the Ubuntu Security Engineer role at Canonical Get AI-powered advice on this job and more exclusive features. Canonical is a leading provider of open source software and operating systems to the global enterprise and technology...