Analista De Dados E Machine Learning

1 semana atrás


Brasília, Brasil Instituto De Pesquisas Eldorado Tempo inteiro

PcDs são sempre bem-vindas.Buscamos pessoas apaixonadas por tecnologia.
Alguém que se motive por desafios e atue com autonomia.
Precisa gostar de trabalhar em equipe e possuir espírito colaborativo.
Para essa vaga a pessoa será responsável por desenhar, implementar e manter soluções avançadas de dados e Machine Learning, garantindo escalabilidade, segurança, alta disponibilidade e observabilidade.Responsabilidades e atribuiçõesDesenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático.Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD).
Projetar pipelines distribuídos e paralelos utilizando PySpark, Dask ou frameworks equivalentes.Gerenciar soluções de observabilidade e monitoramento (logging estruturado, métricas e dashboards no Prometheus, Grafana, ELK e OpenTelemetry).
Estruturar pipelines de CI/CD para dados e modelos (integração e entrega contínua), garantindo versionamento, rastreabilidade e monitoramento de drift.Colaborar na seleção e padronização de ferramentas de orquestração, versionamento e observabilidade.Apoiar equipes de ciência de dados e analytics na produção de modelos de ML, integrando frameworks distribuídos (Horovod, DDP, Spark MLlib).
Requisitos e qualificaçõesGraduação em Ciência da Computação, Engenharia de Software ou áreas correlatas.Python avançado.Testes unitários e de integração (pytest ou unittest) Documentação técnica clara.SQL avançado, conhecimento em NoSQL.Conhecimento de bom de processamento distribuido/paralelo (PySpark, Dask e etc).
Padronização de logging, métricas, monitoramento (Prometheus, Grafana).
ML / MLOps: Experiência em produção de modelos (deploy, monitoramento, re-treino).
Estruturar pipelines CI/CD para dados e modelos.
Criação de pipelines completos de ML (pré-processamento ? treinamento ? deploy ? monitoramento ? re-treino).
Conhecimento de ferramentas de CI/CD.
Definição de métricas e monitoramento de drift de dados e modelos.Experiência com Git (git flow, pull requests, resolução de conflitos).
OpcionalInfraestrutura como código (Terraform, Ansible, Pulumi).
Cloud / On-premise: S3 (Data Lake), Glue (ETL), Athena (serverless analytics), EMR (big data), SageMaker (ML).
Configuração avançada de IAM (roles, policies, cross-account).
Segurança de dados (criptografia em trânsito/reposo, mascaramento).
Infraestrutura: Arquitetura escalável em cloud e/ou on-premises.Kubernetes avançado, configuração de GPU.
Kubernetes avançado (autoscaling, GPU scheduling, tolerations, affinity).
Observabilidade completa (Prometheus, Grafana, ELK, OpenTelemetry).
Arquitetura e Estratégia de Dados: Projetar Data Lakes, Data Warehouses e feature stores.Seleção e padronização de ferramentas de orquestração, versionamento e observabilidade.Arquitetura híbrida (on-premises + cloud) com foco em segurança, compliance (LGPD) e custos.Design de pipelines tolerantes a falhas e com alta disponibilidade.Conhecimento em frameworks distribuídos (Horovod, DDP, Spark MLlib).
Informações adicionais"O Instituto de Pesquisas Eldorado valoriza um ambiente diversificado e se orgulha de ser uma organização que oferece oportunidades de forma igualitária. Todos que se candidatarem serão avaliados, independentemente de raça, deficiência, cor, religião, sexo, identidade ou expressão de gênero, orientação sexual, nacionalidade ou idade".



  • Brasília, Brasil Instituto De Pesquisas Eldorado Tempo inteiro

    Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...


  • Brasília, Brasil Instituto De Pesquisas Eldorado Tempo inteiro

    Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...


  • Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiro

    Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...


  • Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiro

    Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...


  • Brasília, Brasil EMPREGARE.com Tempo inteiro

    Horário: 4 dias remoto e 1 dia presencial. De segunda a sexta-feira em horário comercial.Modalidade: HíbridoDescrição: Desenvolver e implementar modelos de machine learning para diversas aplicações. Analisar e processar grandes volumes de dados para criar soluções preditivas. Avaliar a performance dos modelos e otimizar algoritmos para eficiência....


  • Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiro

    Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...

  • Machine Learning Engineer

    4 semanas atrás


    Brasília, Distrito Federal, Brasil Huna Tempo inteiro

    Prazer, somos a Huna- Deeptech brasileira construindo o futuro do diagnóstico precoce de câncer para 99% da humanidade usando inteligência artificial e exames de rotina:) Construímos tecnologias robustas, éticas e responsáveis para ampliar o acesso à saúde… e que bom que você quer fazer parte dessa trajetória com a gente:) Estamos contratando...


  • Brasília, Brasil Infostrategy Tempo inteiro

    ü Engenheiro de Machine Learning (nível Sênior) – 1 vaga Responsabilidades: Será responsável por desenvolver, implementar e otimizar modelos de aprendizado de máquina, colaborando com equipes multidisciplinares para resolver problemas complexos usando dados. Conhecimentos avançados em engenharia de prompts, no fim, ajudar a empresa na tomada de...

  • Machine Learning Specialist

    2 semanas atrás


    Brasília, Brasil Runtalent Tempo inteiro

    Engenheiro de Machine Learning Senior Requisitos: Experiência sólida com engenharia de software aplicada a dados e machine learning. Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares. Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS. Conhecimento em MLOps e...


  • Brasília, Brasil Instituto Nacional de Telecomunicações - Inatel Tempo inteiro

    O Inatel está recrutando Especialista para atuar na liderança técnica de projetos de Machine Learning, no Inatel Competence Center - PDI SW.Responsabilidades e atribuiçõesDefinir a estratégia técnica do projeto, desenvolver e comunicando uma visão clara e estratégica para a aplicação de Machine Learning, Inteligência Artificial e Data Science na...