SRE Analyst

3 semanas atrás


Rio de Janeiro, Brasil Gorila Tempo inteiro

Estamos em busca de um(a) Site Reliability Engineer (SRE) Sênior para fortalecer a base técnica que sustenta nossa plataforma de dados financeiros. Como SRE na Gorila, você será peça-chave na construção e evolução de uma infraestrutura escalável, observável e resiliente, garantindo que nossos sistemas possam crescer com segurança e agilidade — sem perder o foco em qualidade, performance e confiabilidade.

Você atuará diretamente no suporte à nossa missão: entregar clareza e controle para investidores e instituições através de dados financeiros bem tratados, acessíveis e confiáveis. Isso significa garantir que os pipelines de dados estejam sempre disponíveis, que os sistemas sejam fáceis de operar e monitorar, e que o time de engenharia possa inovar com autonomia e confiança.

No dia a dia, você será responsável por liderar iniciativas de automação, infraestrutura como código, práticas de GitOps e observabilidade, utilizando ferramentas como Kubernetes (EKS), ArgoCD, Crossplane, Istio, Grafana e Prometheus. Seu trabalho será essencial para garantir que nossa plataforma continue sendo uma referência em confiabilidade, tanto para investidores individuais quanto para grandes instituições financeiras que consomem nossos dados via integrações e APIs.

Responsabilidades

Projetar, implementar e manter a infraestrutura baseada em AWS e Kubernetes (EKS)

Criar e gerenciar pipelines de CI/CD utilizando GitHub Actions e ArgoCD

Implementar e gerenciar observabilidade com Grafana, Prometheus, Loki e Tempo

Garantir a segurança e conformidade da infraestrutura, incluindo controle de acesso, rede e comunicação entre serviços com Istio

Automatizar a criação e gerenciamento de recursos na AWS com Terraform, Crossplane e Kustomization

Requisitos Obrigatórios:

Experiência com AWS e serviços como EKS, RDS, IAM, S3, entre outros

Conhecimento sólido em redes, protocolos de comunicação, incluindo TCP/IP, DNS, HTTP, TLS e roteamento

Forte conhecimento em Kubernetes e ferramentas de gerenciamento de infraestrutura

Experiência com ArgoCD e GitOps

Conhecimento avançado em observabilidade e tracing distribuído

Experiência com Istio ou outra solução de Service Mesh

Experiência com automação e infraestrutura como código (Crossplane, Kustomization, Terraform, etc.)

Conhecimento em CI/CD com GitHub Actions ou similares

Experiência em troubleshooting e otimização de PostgreSQL em produção

Conhecimento em scripting (Bash, Python ou Go) para automação

Experiência com práticas de FinOps

Diferenciais:

Experiência com security hardening em ambientes Kubernetes

Experiência com Open Policy Agent ou similares

Experiência com banco de dados PostgreSQL, garantindo alta disponibilidade e otimização de desempenho

Experiência em gerenciamento de Operadores de Bancos de Dados no Kubernetes como CloudNativePG e Zalando



  • Aparecida de Goiânia, Brasil Senior Sistemas Tempo inteiro

    Oportunidade – DevSecOps Analyst (SRE)Estamos em busca de um(a) DevSecOps Analyst (SRE) para atuar em um ambiente dinâmico e desafiador, com foco em garantir a confiabilidade, segurança e performance de serviços críticos.Principais ResponsabilidadesGarantir a confiabilidade, disponibilidade e desempenho dos sistemas em produção.Colaborar com times de...


  • Aparecida de Goiânia, Brasil Senior Sistemas Tempo inteiro

    Oportunidade – DevSecOps Analyst (SRE) Estamos em busca de um(a) DevSecOps Analyst (SRE) para atuar em um ambiente dinâmico e desafiador, com foco em garantir a confiabilidade, segurança e performance de serviços críticos. Principais Responsabilidades Garantir a confiabilidade, disponibilidade e desempenho dos sistemas em produção. Colaborar com...

  • Sre Analyst

    1 semana atrás


    Rio Grande, Brasil Gorila Tempo inteiro

    Estamos em busca de um(a) Site Reliability Engineer (SRE) Sênior para fortalecer a base técnica que sustenta nossa plataforma de dados financeiros.Como SRE na Gorila, você será peça-chave na construção e evolução de uma infraestrutura escalável, observável e resiliente, garantindo que nossos sistemas possam crescer com segurança e agilidade —...