SRE - Senior Site Reliability Engineer

Há 4 dias


São Paulo, São Paulo, Brasil K2 Solutions Tempo inteiro R$90.000 - R$120.000 por ano



Trabalho híbrido na região de Pinheiros/ SP - 3x por semana no escritório


Estamos selecionando um Senior Site Reliability Engineer - SRE para se juntar ao nosso time e desempenhar um papel essencial na manutenção, automação e melhoria da confiabilidade dos sistemas que impulsionam a rede logística da empresa em múltiplas regiões. Essa pessoa garantirá que a plataforma permaneça resiliente, observável e de alto desempenho, ao mesmo tempo em que possibilita inovação rápida e entregas seguras em larga escala.

Responsabilidades:

Definir, implementar e monitorar Service Level Objectives SLOs), SLIs e error budgets em serviços principais.

Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas.

Automatizar tarefas operacionais por meio de infraestrutura como código IaC e pipelines de CI/CD.

Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas.

Desenvolver processos de resposta a
incidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas.

Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência.

Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda.

Melhorar continuamente os pipelines de
deploy, monitoramento e procedimentos de recuperação.

Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade.

Requisitos:

Graduação em Ciência da Computação, Engenharia ou experiência equivalente.

5+ anos de experiência em funções de Site Reliability, DevOps ou Engenharia de Produção.

Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC).

Forte domínio de ferramentas de observabilidade NewRelic, Grafana, Prometheus, ElasticSearch, Kibana).

Experiência na manutenção de sistemas orientados a eventos com Kafka.

Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy.

Experiência na construção e manutenção de pipelines de CI/CD.

Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho.

Disponibilidade para trabalhar em turnos noturnos (escala de plantão).

Disponibilidade para cobrir turnos de trabalho durante períodos de alta demanda e suporte técnico (escalas de plantão).

Disponibilidade para trabalhar horas extras remuneradas, caso seja necessário resolver um problema técnico.

Diferenciais:

Experiência com frameworks de gerenciamento de incidentes.

Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA.

Familiaridade com segurança, compliance e auditoria em ambientes em nuvem.

Entendimento de otimização de custos e engenharia de performance na AWS.

Fluência em inglês (falado e escrito).

***

Empresa de Tecnologia

Contratação via cooperativa


  • Site Reliability Engineer

    1 semana atrás


    São Paulo, São Paulo, Brasil WEX Inc. Tempo inteiro R$70.000 - R$120.000 por ano

    About the Team/RoleWe are seeking a Software Development Engineer Level 3 to join our SRE team dedicated to the Mobility line of business. This role is for a professional with a software development background who will apply SRE principles to ensure the reliability, scalability, and performance of our complex software systems.The ideal candidate will have...


  • São Paulo, São Paulo, Brasil Enter Tempo inteiro R$80.000 - R$120.000 por ano

    A Enter (anteriormente Talisman AI) foi fundada em 2023 com a missão de tornar o Brasil um protagonista em Inteligência Artificial. Unimos a expertise humana à eficiência da IA para ajudar grandes empresas da América Latina a otimizar processos críticos de alto volume e que exigem intenso trabalho manual. Iniciamos nossa jornada aplicando IA para...


  • São Paulo, São Paulo, Brasil WEX Inc. Tempo inteiro R$80.000 - R$160.000 por ano

    About the Team/RoleThe WEX Site Reliability Engineering (SRE) team seeks individuals passionate about developing software and solutions for observability, incident response, reliability, performance, operational excellence, and compliance. As part of the Site Reliability Engineering organization, you will support internal stakeholders and Payment Platform...


  • São Paulo, São Paulo, Brasil Truelogic Tempo inteiro US$120.000 - US$180.000 por ano

    About TruelogicAt Truelogic we are a leading provider of nearshore staff augmentation services headquartered in New York. For over two decades, we've been delivering top-tier technology solutions to companies of all sizes, from innovative startups to industry leaders, helping them achieve their digital transformation goals.Our team of 600+ highly skilled...

  • Site Reliability Engineer

    1 semana atrás


    São Paulo, São Paulo, Brasil DELIVER IT Tempo inteiro R$60.000 - R$120.000 por ano

    Você é uma pessoa com sólida experiência em engenharia de confiabilidade, tem pensamento estratégico, perfil colaborativo e busca constantemente elevar o nível técnico dos times e sistemas com os quais trabalha? Então essa oportunidade é para vocêEstamos em busca de um(a) SRE Sênior (Site Reliability Engineer) para compor uma equipe técnica de...

  • Site Reliability Engineer

    2 semanas atrás


    São Paulo, São Paulo, Brasil Loadsmart Tempo inteiro R$80.000 - R$120.000 por ano

    ARE YOU INTERESTED IN JOINING AN INNOVATIVE LOGISTICS TECHNOLOGY COMPANY? Loadsmart is a growth-stage technology company valued at over $1 billion (a true Tech Unicorn We are a collection of industry veterans and user-centered engineers using innovative technology to fearlessly reinvent the future of freight by helping shippers, brokers, warehouses and...

  • Site Reliability Engineer

    2 semanas atrás


    São Paulo, São Paulo, Brasil DELIVER IT Tempo inteiro R$80.000 - R$120.000 por ano

    Você se considera uma pessoa que tem sede por aprendizado, gosta de trabalhar em equipe e almeja desenvolvimento na carreira? Então essa oportunidade é para vocêEstamos em busca de um(a) SRE Júnior (Site Reliability Engineer) para integrar uma equipe altamente técnica e comprometida com a excelência operacional. O profissional atuará com foco na...


  • São Paulo, São Paulo, Brasil Thales Tempo inteiro R$80.000 - R$120.000 por ano

    Thales people architect identity management and data protection solutions at the heart of digital security. Business and governments rely on us to bring trust to the billons of digital interactions they have with people. Our technologies and services help banks exchange funds, people cross borders, energy become smarter and much more. More than 30,000...


  • São Paulo, São Paulo, Brasil Dev Tempo inteiro R$80.000 - R$160.000 por ano

    We are a US-based outsource software development company that has been delivering exceptional software experience to our clients since 2011, helping technology companies to become industry leaders.Over the past few years, we've been hiring specialists all over the world while our main development centers were in Ukraine. Now, we keep expanding and start...

  • Site Reliability Engineer

    2 semanas atrás


    São Paulo, São Paulo, Brasil Loadsmart Tempo inteiro R$120.000 - R$240.000 por ano

    ARE YOU INTERESTED IN JOINING AN INNOVATIVE LOGISTICS TECHNOLOGY COMPANY?Loadsmart is a growth-stage technology company valued at over $1 billion (a true Tech Unicorn)We are a collection of industry veterans and user-centered engineers using innovative technology to fearlessly reinvent the future of freight by helping shippers, brokers, warehouses and...