
Site Reliability Engineer
3 semanas atrás
A Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina.
Estamos em busca de um(a) Site Reliability Engineer (SRE) com experiência em arquiteturas Cloud, como CloudStack/OpenStack e CEPH, para atuar na sustentação, automação e confiabilidade da nossa infraestrutura.
Procuramos alguém mão na massa, com visão sistêmica e capacidade analítica para evoluir continuamente a operação. Se você tem paixão por redes/tecnologia, gosta de resolver problemas, e quer atuar em uma empresa dinâmica, jovem e inovadora, essa oportunidade é para você.
🔎 Responsabilidades
- Garantir a confiabilidade, disponibilidade e performance dos sistemas e serviços críticos.
- Administrar e evoluir nossa infraestrutura baseada em CloudStack/OpenStack.
- Gerenciar e manter clusters de Ceph (RBD, CephFS, Object Gateway).
- Desenvolver e aplicar automação de rotinas (IaC, pipelines de CI/CD).
- Monitorar métricas, logs e alertas, propondo melhorias contínuas.
- Apoiar times internos em incidentes críticos, realizando troubleshooting avançado.
- Documentar processos, playbooks e boas práticas para aumentar a eficiência operacional.
- Colaborar no planejamento da evolução da arquitetura e definição de SLAs/SLIs/SLOs.
✅ Requisitos Essenciais (Must to Have)
- Experiência comprovada com AWS (EC2, S3, IAM, RDS, VPC, WAF, CloudWatch).
- Vivência com micro-serviços e ambientes isolados.
- Experiência com CloudStack e/ou OpenStack.
- Vivência em administração de storages CEPH e similares (RBD, CephFS, Object Gateway).
- Domínio de Linux (administração, troubleshooting, otimização).
- Conhecimento em Infraestrutura como Código (Terraform, Ansible).
- Experiência com containers e orquestração (Docker, Kubernetes).
- Conhecimentos em redes e segurança (roteamento, VLANs, firewalls, VPNs).
- Vivência com ferramentas de monitoramento e observabilidade (Zabbix, Prometheus, Grafana, ELK).
- Habilidade em análise de incidentes e automação de correções.
🌟 Diferenciais (Nice to Have)
- Formação em: Segurança da Informação, Engenharia da computação, Ciência da computação, Sistemas de informação ou qualquer área da computação ou correlatas como Engenharias de comunicação, infraestrutura, etc.
- Experiência em ambientes críticos e de alta disponibilidade (telecom, ISPs, cloud providers).
- Conhecimentos em protocolos de rede (BGP, OSPF).
- Habilidade em scripting (Python, Bash, Go).
- Vivência em ambientes multi-tenant.
- Noções de FinOps para otimização de custos.
🕐 Detalhes da vaga
- Modelo de contratação: PJ.
- Presencial, com possibilidade futura de atuação híbrida, mediante avaliação de desempenho.
- Durante o período de treinamento: horário comercial.
- Horário de trabalho flexível (flexível mesmo).
- Bônus financeiro por aniversário e tempo de empresa
-
Site Reliability Engineer
3 semanas atrás
Barueri, Brasil Ryz Labs Tempo inteiroJoin to apply for the Site Reliability Engineer role at Ryz Labs 1 week ago Be among the first 25 applicants Join to apply for the Site Reliability Engineer role at Ryz Labs Get AI-powered advice on this job and more exclusive features. Remote position within South AmericaRYZ is seeking a Site Reliability Engineer to join one of our clients, who is...
-
Site Reliability Engineer
3 semanas atrás
Barueri, Brasil Huge Networks Tempo inteiroA Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...
-
Senior Site Reliability Engineer/Devops
2 semanas atrás
Barueri, Brasil Huge Networks Tempo inteiroA Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...
-
Analista de Monitoramento e Observabilidade | SRE
2 semanas atrás
Barueri, Brasil Digiage Tempo inteiroAnalista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer) Buscamos Analista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer). Requisitos Experiência prática com Datadog (APM, logs, métricas, traces e monitors). Vivência em observabilidade e SRE (Site Reliability Engineering). Experiência em configuração de...
-
Site reliability engineer
3 semanas atrás
Barueri, Brasil Huge Networks Tempo inteiroA Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade . Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) ...
-
Site Reliability Engineer
4 semanas atrás
Barueri, São Paulo, Brasil Huge Networks Tempo inteiroA Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade . Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina. Estamos em busca de um(a) Site...
-
Site Reliability Engineer
3 semanas atrás
Barueri, Estado de São Paulo, Brasil Huge Networks Tempo inteiroA Huge Networks é uma empresa de tecnologia especializada em cibersegurança, conectividade IP e infraestrutura de alta disponibilidade. Operamos sistemas críticos e entregamos serviços robustos de internet, garantindo confiabilidade e estabilidade para clientes que dependem da nossa operação em toda a América Latina.Estamos em busca de um(a) Site...
-
Analista de Monitoramento e Observabilidade
2 semanas atrás
Barueri, São Paulo, Brasil Digiage Tempo inteiro R$90.000 - R$120.000 por anoBuscamos Analista de Monitoramento e Observabilidade | SRE (Site Reliability Engineer) RequisitosExperiência prática com Datadog (APM, logs, métricas, traces e monitors).Vivência em observabilidade e SRE (Site Reliability Engineering).Experiência em configuração de retention filters, ingestão e indexação de logs.Vivência com cloud (AWS, Azure,...
-
Software Application Support Engineer
3 semanas atrás
Barueri, Brasil Markem-Imaje Tempo inteiroJoin to apply for the Software Application Support Engineer role at Markem-Imaje 10 hours ago Be among the first 25 applicants Join to apply for the Software Application Support Engineer role at Markem-Imaje Markem-Imaje is a trusted world manufacturer of product identification and traceability solutions, offering a full line of reliable and innovative...
-
Ubuntu Security Engineer
3 semanas atrás
Barueri, Brasil Canonical Tempo inteiroJoin to apply for the Ubuntu Security Engineer role at Canonical 3 days ago Be among the first 25 applicants Join to apply for the Ubuntu Security Engineer role at Canonical Get AI-powered advice on this job and more exclusive features. Canonical is a leading provider of open source software and operating systems to the global enterprise and technology...