Especialista em SRE
2 semanas atrás
DESCRIÇÃO DA VAGA:Você fará parte do time de SRE/DevSecOps responsável por uma plataforma de dados e inteligência artificial em arquitetura Cloud Native, base estratégica para diversos produtos da companhia.Será um papel essencial na evolução técnica e cultural da infraestrutura, garantindo confiabilidade, escalabilidade, segurança e eficiência operacional.A pessoa nessa posição liderará iniciativas de automação, observabilidade e resiliência, além de capacitar outras equipes a entregarem software com mais qualidade, agilidade e segurança.O QUE VOCÊ VAI FAZER:Monitorar continuamente a saúde dos sistemas, criar alertas eficazes e garantir cobertura proativa de incidentes.Responder rapidamente a incidentes críticos, coordenando mitigação, comunicação e resolução.Gerir mudanças, atualizações e implantações com foco em segurança, estabilidade e disponibilidade.Construir e manter pipelines, bibliotecas e automações para provisionamento, deploy e operação em ambientes Cloud de alta disponibilidade.Estabelecer e garantir padrões de security by design em infraestrutura, código e dados.Projetar e evoluir soluções de observabilidade ponta a ponta, integrando logs, métricas, traces e eventos.Gerenciar e melhorar indicadores de confiabilidade (SLIs, SLOs, MTTR, MTTA).Conduzir post-mortems blameless e implementar ações corretivas e preventivas.Influenciar decisões arquiteturais e operacionais visando resiliência, escalabilidade e custo eficiente.Documentar padrões técnicos, playbooks e comunicar impactos técnicos em linguagem de negócio.Definir prioridades estratégicas do backlog de SRE, equilibrando confiabilidade, velocidade de entrega, segurança e custos.Apoiar auditorias, conformidade e governança de segurança em alinhamento com times de risco e compliance.O QUE ESPERAMOS DE VOCÊ:Domínio de conceitos avançados de SRE, DevSecOps e gestão de incidentes.Automação de infraestrutura e pipelines em alto nível, utilizando Shell, Python, Go, Node.js ou Groovy.Experiência com monitoramento e observabilidade distribuída (Prometheus, Grafana, Loki, ELK/Elastic Stack, Datadog, New Relic, OpenTelemetry).Atuação sólida com Cloud pública (GCP, AWS ou equivalente), incluindo provisionamento, automação e otimização de custos.Experiência em CI/CD e DevSecOps avançado, com ferramentas como Git/GitOps, Jenkins, ArgoCD, Maven, SonarQube/Cloud.Proficiência em contêineres e orquestração (Docker, Kubernetes) e Infraestrutura como Código (Terraform, Ansible, CloudFormation, Chef).Vivência com serviços de mensageria e data streaming como Kafka, Redis Streams, Google Pub/Sub, Dataflow.Experiência com bancos de dados SQL e NoSQL, incluindo PostgreSQL, AloyDB, MySQL, MongoDB, Elasticsearch, BigQuery.Experiência em gestão de incidentes e troubleshooting em sistemas complexos, utilizando PagerDuty, Opsgenie, StatusPage, Splunk ou equivalentes.Conhecimento em segurança da informação, compliance e governança de ambientes cloud (LGPD, Privacy by Design, SAST/DAST, IAM, Secret Management).Familiaridade com ambientes de alto volume de dados, tráfego e experiência com design resiliente.Experiência ou interesse em DataOps/MLOps, atuando com pipelines de dados e IA em larga escala (desejável).Background em arquitetura e desenvolvimento de software, com domínio de versionamento, APIs, microserviços e padrões REST/gRPC.Vivência em metodologias ágeis (Scrum, Kanban ou similares).Uso de IA assistiva e ferramentas de produtividade como GitHub Copilot, ChatGPT ou similares (diferencial).Capacidade de mentorar e influenciar tecnicamente outros times, promovendo cultura de automação, segurança e confiabilidade e fomentando a cultura de ownership sobre sistemas em produção.Requisitos desejáveis:Certificações relevantes (AWS, GCP, Kubernetes, Terraform, Security+).Experiência com Service Mesh (Istio, Linkerd) e políticas de segurança zero-trust.Conhecimento em FinOps e gestão de custos em ambientes distribuídos.Experiência com blue/green deployments, canary releases e chaos engineering.Experiência com padronização de deploys por templates (Helm/Kustomize).Prática com observabilidade unificada via OpenTelemetry e tracing distribuído.Vivência em construção de plataformas internas (IDP), uso de Backstage, automação de ambientes.Inglês Intermediário-> AvançadoINFORMAÇÕES ADICIONAISAntes de mostrar nossos benefícios, deixa eu já te contar uma coisa: aqui as coisas acontecem em um ritmo acima da média.A rotina em uma empresa de tecnologia é alucinante e o aprendizado é contínuo e diário. O melhor disso é que temos autonomia para colocar esse aprendizado em prática e buscar resultados.E se errarmos? Voltamos e consertamos rápido, até criarmos aquilo que acreditamos ser parte da transformação de cada cliente.Isso tudo acelera o nosso crescimento e nos torna a maior empresa de tecnologia do Brasil, ditando o ritmo do mercado nos mais diversos setores, fazendo tecnologia que transforma.Dito isso, oferecemos:● Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada colaborador;● Programa +Saudáveis, que cuida de cada colaborador com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;● Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para colaboradores;● Programa + Cuidado, programa de apoio pessoal para colaboradores e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...● Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;● Plano de saúde e odontológico;● Vale refeição e / ou alimentação;● Vale transporte;● Licença maternidade e paternidade estendida;● Espaço de lactário;● Bicicletário;● Vestiário;● Seguro de vida;● Auxílio creche;● Previdência privada;● Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;● Gympass.Nós valorizamos a diversidade e inclusão, consideramos todos os candidatos para as nossas vagas, independente de cor, raça, religião, gênero e identidade de gênero, nacionalidade, deficiência, orientação sexual, ascendência, idade, etc.#Ouseetransforme #sejaTOTVS
-
Especialista SRE
Há 3 dias
Curitiba, Brasil Sankhya Gestão de Negócios Tempo inteiroEstamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala.Missão do cargoComo parte da nossa estrutura de Cloud e SRE, sua...
-
Especialista Em Operações De Nuvem
Há 11 horas
Curitiba, Brasil Bebeeoperações Tempo inteiroDescrição do CargoProcuramos um(a) especialista em operações de nuvem para compor nosso time de desenvolvimento e manutenção de sistemas.Essa pessoa será fundamental na garantia de ambientes performáticos, seguros e altamente disponíveis para suportar a escalabilidade de nossos produtos SaaS.MissãoComo parte da equipe de engenharia de Cloud e SRE,...
-
Site Reliability Engineer Sre
Há 4 dias
Curitiba, Brasil Netvagas Tempo inteiroJoin to apply for the Site reliability engineer sre role at NetvagasSobre a UEXSomos Nerds e Empreendedores!A UEX é um estúdio de tecnologia, que opera no modelo de Startup Studio.Uma empresa de tecnologia, especialista em desenvolvimento, lançamento e operação de produtos e plataformas digitais.COMO VOCÊ VAI CRIAR DRAGÕES?Como Site Reliability...
-
Site reliability engineer sre
3 semanas atrás
Curitiba, Brasil Netvagas Tempo inteiroJoin to apply for the Site reliability engineer sre role at Netvagas Sobre a UEX Somos Nerds e Empreendedores! A UEX é um estúdio de tecnologia, que opera no modelo de Startup Studio. Uma empresa de tecnologia, especialista em desenvolvimento, lançamento e operação de produtos e plataformas digitais. COMO VOCÊ VAI CRIAR DRAGÕES? Como Site...
-
Site reliability engineer
4 semanas atrás
Curitiba, Brasil Netvagas Tempo inteiroSobre a UEX Somos Nerds e Empreendedores! A UEX é um estúdio de tecnologia, que opera no modelo de Startup Studio. Uma empresa de tecnologia, especialista em desenvolvimento, lançamento e operação de produtos e plataformas digitais. COMO VOCÊ VAI CRIAR DRAGÕES?Como Site Reliability Engineer (SRE) aqui na UEX você será responsável por provisionar...
-
Especialista em Monitoring e Observabilidade
2 semanas atrás
Curitiba, Brasil Prime Control Tempo inteiroCuritiba - PR - 1 posição - Não informado - Elegível para PCD - Integral - PJ - CLT - Remoto - Especialista - Vaga Afirmativa Para Pessoas LGBTQIAP+ - Vaga Afirmativa Para Pessoas Pretas - Vaga Afirmativa Para Pessoas Com +40 Anos - Vaga Afirmativa Para Indígenas - Vaga Afirmativa Para Mulheres **Descrição** **Você já conhece a #PrimeControl?** A...
-
Especialista Em Infraestrutura
Há 4 dias
Curitiba, Brasil Bebeeinfraestrutura Tempo inteiroDescrição do CargoO nosso time de SRE é responsável por garantir a confiabilidade, escalabilidade e desempenho das nossas plataformas.Trabalhamos com transparência, comprometimento e autonomia para encontrar as melhores soluções.Nossa jornada é revolucionar o cenário financeiro global e queremos que você faça parte disso conosco.O seu dia a...
-
Especialista Em Banco De Dados
2 semanas atrás
Curitiba, Brasil Junto Seguros Tempo inteiroOlá Somos a Junto SegurosReferência em Seguro Garantia e Fiança Locatícia no BrasilTemos mais de 30 anos de atuação, somos a primeira seguradora, a unir tecnologia à expertise humana para propor soluções inovadoras que movem o país.Com sede em Curitiba e atuação de times multidisciplinares espalhados por todo o Brasil, formamos uma grande equipe...
-
Especialista em Monitoring e Observabilidade
4 semanas atrás
Curitiba, Brasil PRIME CONTROL Tempo inteiroEspecialista em Monitoring e ObservabilidadeVocê já conhece a #PrimeControl? A PrimeControl é uma consultoria de tecnologia engajada em proteger a vida digital das empresas e das pessoas. A PrimeControl é uma consultoria de tecnologia engajada em proteger a vida digital das empresas e das pessoas. Somos a empresa que mais cresceu no Brasil na categoria...
-
Curitiba, Brasil Bebeedesenvolvimento Tempo inteiroFunção do Cargo:Como parte da nossa estrutura de Cloud e SRE, sua missão será assegurar que nossos sistemas estejam sempre disponíveis, performáticos e seguros.Definir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente;Liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;Colaborar com...