SRE - Senior Site Reliability Engineer

1 dia atrás


São Paulo, Brasil K2 Solutions Tempo inteiro

Trabalho híbrido na região de Pinheiros/ SP - 3x por semana no escritório Estamos selecionando um Senior Site Reliability Engineer - SRE para se juntar ao nosso time e desempenhar um papel essencial na manutenção, automação e melhoria da confiabilidade dos sistemas que impulsionam a rede logística da empresa em múltiplas regiões. Essa pessoa garantirá que a plataforma permaneça resiliente, observável e de alto desempenho, ao mesmo tempo em que possibilita inovação rápida e entregas seguras em larga escala. Responsabilidades: Definir, implementar e monitorar Service Level Objectives SLOs), SLIs e error budgets em serviços principais. Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas. Automatizar tarefas operacionais por meio de infraestrutura como código IaC e pipelines de CI/CD. Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas. Desenvolver processos de resposta aincidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas. Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência. Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda. Melhorar continuamente os pipelines dedeploy, monitoramento e procedimentos de recuperação. Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade. Requisitos: Graduação em Ciência da Computação, Engenharia ou experiência equivalente. 5+ anos de experiência em funções de Site Reliability, DevOps ou Engenharia de Produção. Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC). Forte domínio de ferramentas de observabilidade NewRelic, Grafana, Prometheus, ElasticSearch, Kibana). Experiência na manutenção de sistemas orientados a eventos com Kafka. Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy. Experiência na construção e manutenção de pipelines de CI/CD. Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho. Disponibilidade para trabalhar em turnos noturnos (escala de plantão). Disponibilidade para cobrir turnos de trabalho durante períodos de alta demanda e suporte técnico (escalas de plantão). Disponibilidade para trabalhar horas extras remuneradas, caso seja necessário resolver um problema técnico. Diferenciais: Experiência com frameworks de gerenciamento de incidentes. Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA. Familiaridade com segurança, compliance e auditoria em ambientes em nuvem. Entendimento de otimização de custos e engenharia de performance na AWS. Fluência em inglês (falado e escrito). *** Empresa de Tecnologia Contratação via cooperativa


  • Senior Site Reliability

    3 semanas atrás


    São Paulo, Brasil Canonical Tempo inteiro

    Senior Site Reliability / Gitops EngineerJoin to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Senior Site Reliability / Gitops Engineer1 day ago Be among the first 25 applicants Join to apply for the Senior Site Reliability / Gitops Engineer role at Canonical Get AI-powered advice on this job and more exclusive features....


  • São Paulo, Brasil K2 Solutions Tempo inteiro

    Trabalho híbrido na região de Pinheiros/ SP – 3x por semana no escritório Estamos selecionando um Senior Site Reliability Engineer – SRE para se juntar ao nosso time e desempenhar um papel essencial na manutencao, automacao e melhoria da confiabilidade dos sistemas que impulsionam a rede logistica da empresa em multiplas regioes. Essa pessoa garantira...


  • São Paulo, Brasil Chainlink Labs Tempo inteiro

    Join to apply for the Senior Site Reliability Engineer role at Chainlink Labs 2 weeks ago Be among the first 25 applicants Join to apply for the Senior Site Reliability Engineer role at Chainlink Labs Get AI-powered advice on this job and more exclusive features. About UsChainlink Labs is the primary contributing developer of Chainlink, the decentralized...

  • Site Reliability Engineer

    1 semana atrás


    São Paulo, Brasil Deliverit Tempo inteiro

    Site Reliability Engineer (SRE) Júnior - Presencial em São Paulo/SP Você se considera uma pessoa que tem sede por aprendizado, gosta de trabalhar em equipe e almeja desenvolvimento na carreira? Então essa oportunidade é para você! Estamos em busca de um(a) SRE Júnior (Site Reliability Engineer) para integrar uma equipe altamente técnica e...

  • Site Reliability Engineer

    2 semanas atrás


    São Luís, Brasil Premiersoft Tempo inteiro

    OverviewNa Premiersoft, transformamos desafios em soluções.Com mais de uma década de pioneirismo em desenvolvimento mobile, somos movidos por um propósito claro: criar experiências tecnológicas que impulsionam o crescimento e a transformação dos nossos clientes.Nosso time, formado por mais de 200 #Heroes, combina expertise técnica com o nosso DNA:...

  • Site Reliability Engineer

    1 semana atrás


    São Paulo, Brasil Deliverit Tempo inteiro

    Site Reliability Engineer (SRE) Júnior - Presencial em São Paulo/SP Você se considera uma pessoa que tem sede por aprendizado, gosta de trabalhar em equipe e almeja desenvolvimento na carreira? Então essa oportunidade é para você! Estamos em busca de um(a) SRE Júnior (Site Reliability Engineer) para integrar uma equipe altamente técnica e...


  • São Paulo, Brasil Mercado Eletrônico Tempo inteiro

    O Mercado Eletrônico é líder na América Latina em soluções de gestão de compras B2 B. Suas tecnologias e serviços para as áreas de compras ajudam empresas a conquistarem mais economia, agilidade, governança e colaboração. Com escritórios no Brasil, Estados Unidos, México e Portugal, contabiliza mais de 1 milhão de fornecedores, 10 mil...

  • Site Reliability Engineer

    2 semanas atrás


    São Paulo, Brasil Enter A Enter Tempo inteiro

    A Enter (anteriormente Talisman AI) foi fundada em 2023 com a missão de tornar o Brasil um protagonista em Inteligência Artificial. Unimos a expertise humana à eficiência da IA para ajudar grandes empresas da América Latina a otimizar processos críticos de alto volume e que exigem intenso trabalho manual. Iniciamos nossa jornada aplicando IA para criar...

  • Site Reliability Engineer

    2 semanas atrás


    São Paulo, Brasil Thales Tempo inteiro

    Overview Join to apply for the Site Reliability Engineer role at Thales . This position is on-site in our Berrini unit. Position Summary The candidate will be working as a SRE member who will help the organization to constantly ensure reliability, availability and performance of large-scale ODC services. SRE will work closely with development teams to...


  • São Paulo, Brasil Goexecutive Tempo inteiro

    Reliability Engineer (SRE) - Application Performance Specialist Job Openings Reliability Engineer (SRE) - Application Performance Specialist About the job Reliability Engineer (SRE) - Application Performance Specialist Key Responsibilities: Design, develop, and maintain scalable, reliable, and efficient application using NodeJs(NestJS, PostgreSQL and...