
Analista de Dados e Machine Learning
Há 17 horas
PcDs são sempre bem-vindas.
Buscamos pessoas apaixonadas por tecnologia. Alguém que se motive por desafios e atue com autonomia. Precisa gostar de trabalhar em equipe e possuir espírito colaborativo. Para essa vaga a pessoa será responsável por desenhar, implementar e manter soluções avançadas de dados e Machine Learning, garantindo escalabilidade, segurança, alta disponibilidade e observabilidade.
Responsabilidades e atribuições
- Desenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático.
- Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD).
- Projetar pipelines distribuídos e paralelos utilizando PySpark, Dask ou frameworks equivalentes.
- Gerenciar soluções de observabilidade e monitoramento (logging estruturado, métricas e dashboards no Prometheus, Grafana, ELK e OpenTelemetry).
- Estruturar pipelines de CI/CD para dados e modelos (integração e entrega contínua), garantindo versionamento, rastreabilidade e monitoramento de drift.
- Colaborar na seleção e padronização de ferramentas de orquestração, versionamento e observabilidade.
- Apoiar equipes de ciência de dados e analytics na produção de modelos de ML, integrando frameworks distribuídos (Horovod, DDP, Spark MLlib).
Requisitos e qualificações
- Graduação em Ciência da Computação, Engenharia de Software ou áreas correlatas.
- Python avançado.
- Testes unitários e de integração (pytest ou unittest) Documentação técnica clara.
- SQL avançado, conhecimento em NoSQL.
- Conhecimento de bom de processamento distribuido/paralelo (PySpark, Dask e etc).
- Padronização de logging, métricas, monitoramento (Prometheus, Grafana).
- ML / MLOps: Experiência em produção de modelos (deploy, monitoramento, re-treino).
- Estruturar pipelines CI/CD para dados e modelos. Criação de pipelines completos de ML (pré-processamento → treinamento → deploy → monitoramento → re-treino).
- Conhecimento de ferramentas de CI/CD. Definição de métricas e monitoramento de drift de dados e modelos.
- Experiência com Git (git flow, pull requests, resolução de conflitos).
Opcional
- Infraestrutura como código (Terraform, Ansible, Pulumi). Cloud / On-premise: S3 (Data Lake), Glue (ETL), Athena (serverless analytics), EMR (big data), SageMaker (ML).
- Configuração avançada de IAM (roles, policies, cross-account).
- Segurança de dados (criptografia em trânsito/reposo, mascaramento).
- Infraestrutura: Arquitetura escalável em cloud e/ou on-premises.
- Kubernetes avançado, configuração de GPU. Kubernetes avançado (autoscaling, GPU scheduling, tolerations, affinity).
- Observabilidade completa (Prometheus, Grafana, ELK, OpenTelemetry).
- Arquitetura e Estratégia de Dados: Projetar Data Lakes, Data Warehouses e feature stores.
- Seleção e padronização de ferramentas de orquestração, versionamento e observabilidade.
- Arquitetura híbrida (on-premises + cloud) com foco em segurança, compliance (LGPD) e custos.
- Design de pipelines tolerantes a falhas e com alta disponibilidade.
- Conhecimento em frameworks distribuídos (Horovod, DDP, Spark MLlib).
Informações adicionais
"O Instituto de Pesquisas Eldorado valoriza um ambiente diversificado e se orgulha de ser uma organização que oferece oportunidades de forma igualitária. Todos que se candidatarem serão avaliados, independentemente de raça, deficiência, cor, religião, sexo, identidade ou expressão de gênero, orientação sexual, nacionalidade ou idade".
-
Analista de Dados e Machine Learning
3 semanas atrás
Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiroDesenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...
-
Analista de Dados e Machine Learning
2 semanas atrás
Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiroDesenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...
-
Analista de Dados e Machine Learning
3 semanas atrás
Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiroDesenvolver e otimizar pipelines de dados e de machine learning, desde ingestão, pré-processamento, treinamento, deploy até monitoramento e re-treino automático. Especificar e implementar estratégia de arquitetura de dados (Data Lakes, Data Warehouses, feature stores), com foco em padronização, governança e compliance (LGPD). Projetar pipelines...
-
Engenheiro Machine Learning
2 semanas atrás
Brasília, Distrito Federal, Brasil Bluesix Consultoria Tempo inteiro R$90.000 - R$120.000 por anoRemoto - Modelo PJ Machine Learning Engineer Sr. (1 vaga)Requisitos:Experiência sólida em deploy de modelos de ML em produção.Python avançado + frameworks (Scikit-learn, TensorFlow, PyTorch).Vivência com MLFlow, Databricks e CI/CD para modelos. Interessados, entrem em contato ou enviem o currículo diretamente para
-
Cientista de Dados
Há 4 dias
Brasília, Distrito Federal, Brasil Qintess Tempo inteiro R$90.000 - R$120.000 por anoA Qintess é especialista em potencializar a essência do seu negócio. Nossas soluções de transformação digital permitem que sua empresa opere com rapidez e flexibilidade, acompanhando as mudanças de um mercado em constante evolução.Aliados às melhores práticas em ESG, desenvolvemos capacidades digitais com inteligência e design inovador para...
-
Cientista de Dados Sênior
2 semanas atrás
Brasília, Distrito Federal, Brasil Bluesix Consultoria Tempo inteiro R$90.000 - R$120.000 por anoEstamos em busca de um Cientista de Dados Sênior para atuar em um projeto estratégico, em parceria com a Bluesix Consultoria . Modelo de contratação: PJ (Subcontratação Bluesix) Local: 100% Home Office Duração do projeto: até 31/12/2025 (com possibilidade de extensão)Requisitos:Vivência consolidada como Cientista de Dados;Experiência em...
-
Analista de dados sênior
Há 3 dias
Brasília, Distrito Federal, Brasil Sicoob Tempo inteiro R$90.000 - R$120.000 por anoA área deComercial de Crédito e Serviçosé responsável pela promoção comercial, desenvolvimento de produtos, ações de mercado e capacitação das cooperativas centrais e singulares do Sicoob, com foco nos produtos de crédito – sejam eles geridos pelas próprias cooperativas ou pelo CCS.AtividadesColetar, organizar, tratar e interpretar grandes...
-
Pessoa Desenvolvedora De Software
4 semanas atrás
Brasília, Distrito Federal, Brasil buscojobs Brasil Tempo inteiroMissão do cargo Como Engenheiro de Software em Machine Learning no time Machine Learning Platform, você criará ferramentas e soluções para os cientistas de dados da empresa, desde a concepção até o lançamento em produção de soluções de MLOps. Suas responsabilidades incluirão evoluir nossa feature store, desenvolver protótipos para provas de...
-
Engenheiro de Dados Pleno
Há 4 dias
Brasília, Distrito Federal, Brasil Vaganet Tempo inteiro R$90.000 - R$120.000 por anoDescrição das atividades que o profissional irá realizar:Executa técnicas estatísticas para seleção de variáveis, amostragem e planejamento de experimentos. Executa técnicas de segmentação, modelagem estatística e computacional (por exemplo IA e Machine Learning).Executa técnicas de mineração de dados, estrutura de dados e soluções com...
-
Analista de Dados
3 semanas atrás
Brasília, Distrito Federal, Distrito Federal, Brasil Instituto de Pesquisas Eldorado Tempo inteiroEstruturar informações de forma taxonômica e otimizada em banco de dados. Analisar bases de dados e desenvolver dashboards que entreguem insights relevantes. Realizar coleta e enriquecimento de dados a partir de múltiplas fontes:API’s públicas e privadas (pagas). Extração de dados de páginas públicas da web (web scraping e robôs de navegação)....