Cientista de dados python
4 semanas atrás
Descrição Descrição da vaga e responsabilidades Precisamos de um(a) cientista de dados com domínio de Python e experiência prática em Large Language Models (LLMs) para desenvolver análises, protótipos e soluções de IA em ambiente Google Cloud Platform. Responsabilidades-chave Explorar, limpar e preparar dados estruturados e não estruturados usando Python, Pandas, PySpark ou BigQuery. Treinar, ajustar (fine tune) e avaliar modelos de machine learning, incluindo LLMs, garantindo métricas de qualidade e desempenho. Projetar prompts eficazes, implementar fluxos de RAG (Retrieval Augmented Generation) e conduzir experimentos de IA generativa. Construir pipelines de experimentação e automação (MLFlow, Airflow ou ferramentas equivalentes). Provisionar, configurar e otimizar instâncias Compute Engine (CPU/GPU) para treinar ou servir modelos quando serviços gerenciados não atenderem. Desenvolver scripts de deploy e monitoramento em GCP (Cloud Build, Cloud Monitoring, Logging). Documentar processos, versionar código em Git e participar de code reviews. Apresentar insights e resultados por meio de notebooks Jupyter, dashboards ou relatórios executivos. Requisitos Requisitos da vaga Obrigatórios Sólida experiência em Python para ciência de dados (Pandas, NumPy, Scikit learn). Conhecimento prático de LLMs: uso de APIs, fine tuning básico, criação de prompts e avaliação de outputs. Experiência em modelagem e treinamento de algoritmos clássicos de ML, feature engineering e ajuste de hiperparâmetros. Boa comunicação para explicar resultados técnicos a times multidisciplinares. Diferenciais Familiaridade com Google Cloud Platform, incluindo: BigQuery e Cloud Storage para dados. Compute Engine: criação, configuração e otimização de instâncias (CPU/GPU). Ferramentas de automação (Cloud Build, Cloud Logging/Monitoring) para CI/CD e observabilidade. Proficiência em SQL para análise e modelagem de dados. Git para versionamento de código e trabalho colaborativo. Experiência com bibliotecas de IA generativa open source (Hugging Face Transformers, LangChain, Llama Index). Conhecimento de MLOps (MLFlow Registry, TFX, CI/CD para modelos). Implementação de pipelines de dados/ML em Airflow ou Composer. Participação em competições de ciência de dados ou publicações técnicas. Noções de IA generativa multimodal (texto + imagem ou visão computacional).
-
Cientista de dados pl/sr
Há 2 dias
HOME OFFICE, Brasil Stefanini Group Tempo inteiroGraduação em Ciência da Computação, Engenharia de Software, Sistemas de Informação ou áreas relacionadas. Diferenciais:Experiência com ferramentas de orquestração de dados, como Airflow ou Dagster. Experiência com modelagem dimensional. Experiência com frameworks para APIs, como FastAPI. Conhecimento básico em Docker. Experiência com testes...
-
Cientista de dados pleno
4 semanas atrás
HOME OFFICE, Brasil Paipe Tempo inteiroDescrição da Vaga: Você é apaixonado por tecnologia, inovação e quer fazer parte de uma equipe que está transformando o futuro com IA e Machine Learning? Então, essa é a sua chance!Estamos buscando um(a) Cientista de Dados Pleno venha fazer parte do nosso time. ATIVIDADES:Executar análises exploratórias de dados. Auxiliar na criação de...
-
Cientista de dados sênior
2 semanas atrás
HOME OFFICE, Brasil Leega Consultoria Tempo inteiroFormação em Estatística, Matemática, Ciência de Dados, Engenharia, Economia ou áreas correlatas (bacharelado ou mestrado completo); Experiência anterior comprovada em instituições financeiras, bureaux de crédito e/ou consultorias analíticas; Domínio de linguagens como SQL e Python para manipulação, análise e modelagem de dados; Vivência com...
-
Cientista de dados pleno
2 semanas atrás
HOME OFFICE, Brasil Leega Consultoria Tempo inteiroFerramentas de Dados: Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados: Conhecimento em SQL. Data Lakes e Data Warehouses: Capacidade de gerenciar Data...
-
Cientista de dados júnior
2 semanas atrás
HOME OFFICE, Brasil Leega Consultoria Tempo inteiroFerramentas de Dados: Experiência com ferramentas para CI/CD e automação de fluxos de machine learning. Observabilidade de Dados. Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines. Bancos de Dados e Armazenamento de Dados: Conhecimento em SQL. Data Lakes e Data Warehouses: Capacidade de gerenciar Data...
-
Cientista de Dados
Há 7 horas
HOME OFFICE, Brasil Peers Tempo inteiroSomos uma das consultorias que mais cresce no Brasil. Atuamos em negócios & tecnologia com foco em transformações que geram valor, deixando as companhias mais eficientes e competitivas. Desde sua criação em 2012, a Peers cresce de forma acelerada e sustentável, em faturamento, resultado e equipe. Nossos colaboradores contam com: Remuneração...
-
Cientista de dados pleno/sênior | remoto
Há 4 dias
HOME OFFICE, Brasil ICON Solutions do Brasil Tempo inteiroPosição - Cientista de Dados - Pleno/Sênior (Remoto) Você conhece a Icon? Apaixonados por pessoas e especialistas em tecnologia. Nosso trabalho é encontrar talentos e soluções sob medida para os nossos clientes. Vem encontrar o seu projeto ideal conosco e participar da comunidade ICON! Sobre a Vaga Código da vaga: A Modelo de contratação: PJ Gerar...
-
Cientista de dados jr
1 semana atrás
HOME OFFICE, Brasil Magazine Luiza Tempo inteiroO capítulo de Ciência de Dados reúne os profissionais dessa especialidade para que sejam o centro de excelência técnica dentro da Tribo de AI Products, atuando de forma direta com problemas complexos e de grande escala. A comunidade auxilia cada um dos cientistas a elevar a barra técnica nas suas atuações em times multidisciplinares de diferentes...
-
Cientista de dados | genai
4 semanas atrás
HOME OFFICE, Brasil MadeinWeb Tempo inteiroReferência em soluções GenAI, responsável por definir abordagens, padrões e práticas para projetos de LLMs, RAG e pipelines de IA, orientar times e garantir entregas escaláveis e alinhadas ao negócio.PRINCIPAIS ATIVIDADES: Projetar e implementar soluções avançadas com GenAI: LLMs, RAG, agentes e pipelines de IA ponta a ponta.Definir abordagens...
-
5ee1 cientista de dados
2 semanas atrás
HOME OFFICE, Brasil Extreme Digital Solutions Tempo inteiroSobre nós Somos uma startup recifense focada no desenvolvimento de soluções digitais inovadoras que geram impacto real no setor público. Atuamos em áreas essenciais como saúde, educação e justiça, sempre com o propósito de transformar serviços públicos por meio da tecnologia. Procuramos profissionais que entendam a importância do sucesso dos...