Profissional cientista de dados sênior

2 semanas atrás


HOME OFFICE, Brasil Radix Tempo inteiro

A primeira coisa que você precisa saber é que aqui você não vai cair na rotina. A Radix desenvolve soluções para empresas de diferentes setores e indústrias. Cada projeto tem suas tecnologias, soluções e prazos e você terá oportunidade de atuar e experimentar diferentes desafios. Além da nossa atuação pelo Brasil, com escritório no Rio de janeiro, São Paulo e Belo Horizonte, temos também filiais nos Estados Unidos, fazendo com que a Radix se consolide cada vez mais como uma empresa global.    Quer fazer parte dessa história e transformar ideias e sonhos em realidade?  Como Cientista de Dadosvocê vai:     Avaliar e implementar soluções baseadas em LLMs (open-source ou APIs comerciais como OpenAI, Azure OpenAI, Anthropic, Cohere etc.). ·         Apoiar na estruturação e evolução de plataformas de GenAI internas (chatbots, copilots, RAG, assistentes de produtividade). ·         Trabalhar com arquiteturas de Retrieval-Augmented Generation (RAG), prompt engineering, fine-tuning e embeddings. ·         Integrar LLMs com sistemas internos e dados proprietários de forma segura e escalável. ·         Definir padrões de governança, rastreabilidade e uso responsável da IA generativa. ·         Atuar junto a equipes de produto e desenvolvimento para incorporar IA generativa em jornadas e fluxos de trabalho. ·         Apoiar iniciativas de segurança, conformidade e mitigação de riscos ligados ao uso de IA. ·         Promover a disseminação de conhecimento e boas práticas de uso da IA na organização. ·         Projetar e operar pipelines de ingestão/ELT (batch e streaming) a partir de múltiplas fontes (APIs REST/Graph, arquivos, bancos relacionais/NoSQL, mensageria). ·         Orquestrar fluxos de dados com Airflow/Dagster/Prefect e, quando aplicável, CDC (ex.: Debezium). ·         Modelar dados e padronizar formatos (Parquet/Delta), organizando camadas Bronze/Silver/Gold em data lakes (ex.: S3/ADLS) e/ou warehouses. ·         Implementar catálogos, linhagem e contratos de dados (ex.: OpenMetadata/Amundsen; testes de qualidade com Great Expectations). ·         Construir e manter pipelines de vetorização e indexação (pgvector, Pinecone, Weaviate, Milvus), incluindo estratégias de refresh/reindex e re-ranking. ·         Configurar conectores e parsing de documentos (OCR e extração de PDF/Office com Unstructured, Azure Form Recognizer, etc.). ·         Instrumentar observabilidade ponta a ponta (logs, métricas, traces) e otimização de custo/latência em serviços GenAI e dados. Requisitos necessários para a vaga ·         Experiência comprovada com aplicações de IA generativa, especialmente LLMs (incluindo RAG). ·         Conhecimento prático em uso de APIs de LLMs (OpenAI, Azure OpenAI, Cohere, HuggingFace, etc.). ·         Familiaridade com técnicas de prompt engineering e/ou fine-tuning (LoRA/PEFT). ·         Experiência em projetos com dados não estruturados (textos, documentos, etc.). ·         Experiência com ferramentas como LangChain, LlamaIndex ou equivalentes. ·         Experiência com frameworks de agentes de IA (LangGraph, Semantic Kernel, etc.). ·         Conhecimento em vetorização de dados e uso de bancos de vetor (Pinecone, Weaviate, Milvus, FAISS, pgvector etc.). ·         Sólida experiência em Engenharia de Dados: ingestão/ELT, modelagem, qualidade e linhagem; pipelines batch/stream; mensageria (Kafka/Event Hubs). ·         Domínio de Python e SQL para prototipação e deploy; integração com APIs REST/Graph e pipelines de dados. ·         Vivência com orquestradores (Airflow/Dagster/Prefect) e organização de dados em Parquet/Delta (camadas Bronze/Silver/Gold) em S3/ADLS. ·         Prática com CI/CD (GitHub Actions/Azure DevOps), IaC (Terraform) e execução em cloud (Azure e/ou AWS) - preferencialmente em serviços gerenciados (App Service, ECS Fargate). ·         Conhecimentos de segurança e governança (PII/DLP, RBAC/OIDC - ex.: Keycloak/Azure AD, criptografia, auditoria). Requisitos desejáveis para a vaga ·         Experiência com modelos open source (Mistral, LLaMA, Qwen, etc.) e servidores de inferência (vLLM/TGI). ·         Familiaridade com MLOps e deploy/monitoramento de modelos em produção. ·         Experiência com Spark/Databricks, dbt, DuckDB e/ou CDC (Debezium). ·         Uso de catálogo/linhagem e testes de dados (OpenMetadata/Amundsen; Great Expectations). ·         Conhecimento sobre ética e riscos da IA (bias, alucinação, privacidade).        ·         Inglês técnico. Benefícios:   Assistência Médica Nacional (para o titular e dependentes, com quarto privativo) Assistência odontológica nacional (para o titular e dependentes) Vale refeição / alimentação flexível Auxílio home office  Day off (no mês do aniversário) Wellhub (antigo Gympass) Licença Maternidade (6 meses) e Paternidade (20 dias) estendidas Auxílio creche para filhos de até 3 anos (por filho)  Apoio em saúde mental com a Wellz Clube de Vantagens com descontos em diversos parceiros Convênio com instituições de ensino e cursos de idioma Desenvolvimento Profissional (Universidade Corporativa) Parceria com empresa de coworkings no Brasil Programa de Qualidade de Vida e Bem-Estar Médico consultor para acompanhamento de radixers Planos de incentivos A Radix está sempre no topo das Melhores Empresas para se trabalhar porque:   Temos profissionais comprometidos, dedicados, curiosos e inovadores.  O espírito de equipe é a nossa maior força. Trabalhamos de forma cooperativa e sabemos que estamos juntos, remando na mesma direção. Temos um ambiente diverso, que valoriza equidade e inclusão.  Nossa jornada de trabalho é flexível e em quase todos os projetos é possível trabalhar de qualquer lugar do Brasil.  Valorizamos o bem-estar e o cuidado com as nossas pessoas, com programas de apoio à saúde mental, psiquiatra e médico consultor disponíveis.   Curtiu?   #VemPraRadix 



  • HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Formação em Estatística, Matemática, Ciência de Dados, Engenharia, Economia ou áreas correlatas (bacharelado ou mestrado completo); Experiência anterior comprovada em instituições financeiras, bureaux de crédito e/ou consultorias analíticas; Domínio de linguagens como SQL e Python para manipulação, análise e modelagem de dados; Vivência com...

  • Cientista de dados sênior

    3 semanas atrás


    HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Cloud: Experiência avançada em AWS (foco em Data & AI services). MLOps: CI/CD, automação de pipelines, monitoramento e escalabilidade de modelos. Programação: Python (pandas, scikit-learn, TensorFlow, PyTorch, statsmodels, MLflow). Versionamento: Git/GitHub (fluxos de colaboração, revisão de código, integração contínua). Machine Learning:...


  • HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Ferramentas de Dados:  Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados:  Conhecimento em SQL. Data Lakes e Data Warehouses:  Capacidade de gerenciar Data...


  • HOME OFFICE, Brasil Leega Consultoria Tempo inteiro

    Ferramentas de Dados:  Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados:  Conhecimento em SQL. Data Lakes e Data Warehouses:  Capacidade de gerenciar Data...

  • Cientista de Dados

    4 semanas atrás


    HOME OFFICE, Brasil Peers Tempo inteiro

    Somos uma das consultorias que mais cresce no Brasil. Atuamos em negócios & tecnologia com foco em transformações que geram valor, deixando as companhias mais eficientes e competitivas. Desde sua criação em 2012, a Peers cresce de forma acelerada e sustentável, em faturamento, resultado e equipe.  Nossos colaboradores contam com:  Remuneração...

  • Cientista de dados | genai

    3 semanas atrás


    HOME OFFICE, Brasil MadeinWeb Tempo inteiro

    Referência em soluções GenAI, responsável por definir abordagens, padrões e práticas para projetos de LLMs, RAG e pipelines de IA, orientar times e garantir entregas escaláveis e alinhadas ao negócio.PRINCIPAIS ATIVIDADES: Projetar e implementar soluções avançadas com GenAI: LLMs, RAG, agentes e pipelines de IA ponta a ponta.Definir abordagens...

  • Cientista de dados pleno

    4 semanas atrás


    HOME OFFICE, Brasil Conta Simples Tempo inteiro

    O que esperamos de você: Experiência como cientista de dados - Mínimo de 2 anos; Conhecimento sólido em Estatística; Experiência em modelos preditivos e machine learning (aplicações em negócio); Proficiência em Python; Conhecimento em bancos relacionais e não relacionais (NoSQL); Experiência com modelos preditivos em produção;  SQL avançado;...

  • Cientista de dados pleno

    3 semanas atrás


    HOME OFFICE, Brasil CERC Tempo inteiro

    RESPONSABILIDADES E ATRIBUIÇÕESComo Cientista de Dados na CERC, você vai:  Construir, implementar e escalar modelos de machine learning e soluções analíticas para alavancar insights de negócios. Estruturar processos, ferramentas e boas práticas para a área, garantindo governança e eficiência no uso dos dados. Atuar de forma prática no...


  • HOME OFFICE, Brasil Radix Tempo inteiro

    A primeira coisa que você precisa saber é que aqui você não vai cair na rotina. A Radix desenvolve soluções para empresas de diferentes setores e indústrias. Cada projeto tem suas tecnologias, soluções e prazos e você terá oportunidade de atuar e experimentar diferentes desafios. Além da nossa atuação pelo Brasil, com escritório no Rio de...

  • Cientista de dados jr

    Há 9 horas


    HOME OFFICE, Brasil Magazine Luiza Tempo inteiro

    O capítulo de Ciência de Dados reúne os profissionais dessa especialidade para que sejam o centro de excelência técnica dentro da Tribo de AI Products, atuando de forma direta com problemas complexos e de grande escala. A comunidade auxilia cada um dos cientistas a elevar a barra técnica nas suas atuações em times multidisciplinares de diferentes...