Cientista de dados júnior

Há 5 dias


HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

Ferramentas de Dados:  Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados:  Conhecimento em SQL. Data Lakes e Data Warehouses:  Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks. Armazenamento de Features. Cloud e Infraestrutura Nuvem: Azure + Databricks. Conhecimento em Modelagem de IA:  Capacidade de colaborar com os demais Cientistas de Dados para preparar conjuntos de dados para modelos de IA, garantindo alta qualidade e performance. MLOps:  Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA. Gestão de Features:  Capacidade de definir e gerenciar repositórios de features para modelos de IA (Feature Engineering). Conhecimentos Complementares Privacidade e Segurança de Dados: Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA. Metodologias Ágeis: Experiência de trabalho com metodologias ágeis (Scrum/Kanban). Capacidade Analítica: Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA. Atuação: Modelo Remoto O que é a área de Ciência de DadosA área de Ciência de Dados é responsável por aplicar técnicas estatísticas e algoritmos de Machine Learning (ML) para analisar grandes volumes de dados, identificar padrões e construir modelos preditivos. O foco principal é extrair insights acionáveis que suportam a tomada de decisão estratégica, otimizam processos de negócio (como precificação, detecção de fraudes e retenção de clientes) e impulsionam a inovação com soluções baseadas em dados. Você atuará na interface entre os desafios do negócio e a implementação técnica no ambiente Azure Databricks. Seus Principais Desafios Serão:Compreender as Necessidades do Negócio e Requisitos de ML/IA: Colaborar com stakeholders e Cientistas de Dados Sêniores para entender os problemas de negócio e traduzi-los em hipóteses testáveis e projetos de Machine Learning. Participar de Discussões Baseadas em Dados e IA: Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA. Interface entre Times de Tecnologia e Data Science: Trabalhar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos. Preparação e Exploração de Dados no Azure Databricks: Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark. Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes (Feature Engineering) Desenvolvimento e Validação de Modelos de ML: Construir, treinar e validar modelos preditivos (regressão, classificação, clustering) utilizando frameworks de Ciência de Dados como Scikit-Learn, TensorFlow ou PyTorch. Documentar e apresentar os resultados e métricas de desempenho dos modelos (e.g., AUC, F1-Score). Apoiar a Operacionalização (MLOps): Auxiliar na transição dos modelos desenvolvidos para ambientes de produção, utilizando ferramentas como MLflow para rastreamento e gerenciamento de experimentos e modelos no Azure Databricks. Monitoramento da Qualidade dos Dados e Modelos: Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção, propondo ajustes quando necessário. O que Você Precisa para Fazer Parte Deste Time:Arquitetura e Ferramentas de Dados:Foco em Azure Databricks: Conhecimento e experiência prática na utilização de Azure Databricks para processamento e análise de dados, incluindo a utilização de notebooks (Python/Spark) e gerenciamento de clusters. Feature Store/Data Lake: Entendimento do conceito de Feature Store e experiência em consumir dados de Data Lakes (preferencialmente Azure Data Lake Storage) e estruturar dados para o consumo de modelos. Programação e Frameworks de Ciência de Dados:Linguagens: Python (Imprescindível) para manipulação de dados (Pandas, NumPy) e desenvolvimento de modelos. Frameworks de ML/IA (Foco em Treinamento): Experiência prática com as principais bibliotecas e frameworks como Scikit-Learn (modelos clássicos), TensorFlow/Keras ou PyTorch (para aprendizado profundo) e bibliotecas como XGBoost/LightGBM. Gestão de Experimentos: Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos no ambiente Databricks. Consultas e Transformação: Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.


  • Cientista de dados sênior

    3 semanas atrás


    HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Cloud: Experiência avançada em AWS (foco em Data & AI services). MLOps: CI/CD, automação de pipelines, monitoramento e escalabilidade de modelos. Programação: Python (pandas, scikit-learn, TensorFlow, PyTorch, statsmodels, MLflow). Versionamento: Git/GitHub (fluxos de colaboração, revisão de código, integração contínua). Machine Learning:...

  • Cientista de dados | genai

    2 semanas atrás


    HOME OFFICE, Brasil MadeinWeb Tempo inteiro

    Referência em soluções GenAI, responsável por definir abordagens, padrões e práticas para projetos de LLMs, RAG e pipelines de IA, orientar times e garantir entregas escaláveis e alinhadas ao negócio.PRINCIPAIS ATIVIDADES: Projetar e implementar soluções avançadas com GenAI: LLMs, RAG, agentes e pipelines de IA ponta a ponta.Definir abordagens...

  • Cientista de dados pleno

    4 semanas atrás


    HOME OFFICE, Brasil Conta Simples Tempo inteiro

    O que esperamos de você: Experiência como cientista de dados - Mínimo de 2 anos; Conhecimento sólido em Estatística; Experiência em modelos preditivos e machine learning (aplicações em negócio); Proficiência em Python; Conhecimento em bancos relacionais e não relacionais (NoSQL); Experiência com modelos preditivos em produção;  SQL avançado;...

  • Cientista de dados pleno

    3 semanas atrás


    HOME OFFICE, Brasil CERC Tempo inteiro

    RESPONSABILIDADES E ATRIBUIÇÕESComo Cientista de Dados na CERC, você vai:  Construir, implementar e escalar modelos de machine learning e soluções analíticas para alavancar insights de negócios. Estruturar processos, ferramentas e boas práticas para a área, garantindo governança e eficiência no uso dos dados. Atuar de forma prática no...


  • HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Formação em Estatística, Matemática, Ciência de Dados, Engenharia, Economia ou áreas correlatas (bacharelado ou mestrado completo); Experiência anterior comprovada em instituições financeiras, bureaux de crédito e/ou consultorias analíticas; Domínio de linguagens como SQL e Python para manipulação, análise e modelagem de dados; Vivência com...


  • HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Ferramentas de Dados:  Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados:  Conhecimento em SQL. Data Lakes e Data Warehouses:  Capacidade de gerenciar Data...

  • Cientista de Dados

    4 semanas atrás


    HOME OFFICE, Brasil Peers Tempo inteiro

    Somos uma das consultorias que mais cresce no Brasil. Atuamos em negócios & tecnologia com foco em transformações que geram valor, deixando as companhias mais eficientes e competitivas. Desde sua criação em 2012, a Peers cresce de forma acelerada e sustentável, em faturamento, resultado e equipe.  Nossos colaboradores contam com:  Remuneração...

  • Cientista de dados pleno

    3 semanas atrás


    HOME OFFICE, Brasil Paipe Tempo inteiro

    Descrição da Vaga: Você é apaixonado por tecnologia, inovação e quer fazer parte de uma equipe que está transformando o futuro com IA e Machine Learning? Então, essa é a sua chance!Estamos buscando um(a) Cientista de Dados Pleno venha fazer parte do nosso time. ATIVIDADES:Executar análises exploratórias de dados.  Auxiliar na criação de...

  • Cientista de dados pleno

    4 semanas atrás


    HOME OFFICE, Brasil JOTA Tempo inteiro

    O que esperamos de você? O JOTA busca um/a cientista de dados para atuar no desenho de produtos de informação e para desenvolver análises e modelos que orientem decisões estratégicas. É desejável experiência de pelo menos dois anos em análise de dados, estatística ou ciência de dados ou experiência equivalente em projetos relevantes....


  • HOME OFFICE, Brasil Extreme Digital Solutions Tempo inteiro

    Sobre nós Somos uma startup recifense focada no desenvolvimento de soluções digitais inovadoras que geram impacto real no setor público. Atuamos em áreas essenciais como saúde, educação e justiça, sempre com o propósito de transformar serviços públicos por meio da tecnologia. Procuramos profissionais que entendam a importância do sucesso dos...