Engenheiro de dados e ML

Há 4 dias


Rio de Janeiro, Brasil Engineering Brasil Tempo inteiro

Buscamos um(a) profissional para atuar na interseção entre Engenharia de Dados e Inteligência Artificial na plataforma Microsoft Azure. O(a) candidato(a) ideal será responsável por construir a infraestrutura de dados moderna que alimenta soluções de Machine Learning e IA Generativa, desde a ingestão e transformação de dados até a implantação de modelos em produção. Este papel híbrido combina expertise em arquitetura de dados com desenvolvimento de soluções de IA utilizando Azure OpenAI, Azure Machine Learning e todo o ecossistema de dados Azure.Qual será o seu papel?Arquitetar e implementar soluções de Data Lakehouse utilizando Azure Data Lake Storage Gen2, Delta Lake e Azure Synapse AnalyticsDesenvolver pipelines de ETL/ELT escaláveis com Azure Data Factory, Synapse Pipelines e Azure DatabricksConstruir arquiteturas de streaming em tempo real com Azure Event Hubs, Stream Analytics e KafkaImplementar soluções de Data Mesh e governança de dados com Microsoft PurviewModelar dados dimensionais e criar camadas de dados (bronze, silver, gold) para consumo analítico e de MLOtimizar performance de consultas e custos de armazenamento/processamento na plataforma AzureGarantir qualidade de dados com frameworks de data quality e testes automatizadosProjetar e implementar arquiteturas de IA Generativa utilizando Azure OpenAI Service (GPT-4, embeddings, fine-tuning)Desenvolver pipelines de Machine Learning end-to-end com Azure Machine Learning, desde feature engineering até produçãoCriar e otimizar sistemas RAG (Retrieval-Augmented Generation) com Azure AI Search e Azure Cosmos DBImplementar feature stores e pipelines de feature engineering para modelos de MLAplicar práticas de MLOps para versionamento, monitoramento e governança de modelosDesenvolver APIs e microsserviços para exposição de modelos via Azure Functions e Container AppsIntegrar soluções de IA com pipelines de dados para processamento de documentos, imagens e texto não estruturado.Esperamos que você tenha:Experiência sólida com Azure Data Factory, Azure Synapse Analytics e Azure DatabricksProficiência em SQL avançado, PySpark e frameworks de processamento distribuídoConhecimento em Delta Lake, Apache Iceberg ou formatos de tabela open-sourceExperiência com Azure Event Hubs, Kafka e arquiteturas de streamingDomínio de modelagem dimensional (Kimball, Data Vault) e arquiteturas LakehouseExperiência com Azure Cosmos DB, Azure SQL e bancos de dados NoSQLProficiência em Python e bibliotecas de ML/DL (scikit-learn, TensorFlow, PyTorch, Hugging Face)Experiência comprovada com Azure Machine Learning e Azure OpenAI ServiceConhecimento sólido em LLMs, prompt engineering, fine-tuning e técnicas de RAGExperiência com bancos de dados vetoriais (Azure AI Search, Pinecone, Weaviate, Chroma)Conhecimento em Azure AI Services (Document Intelligence, Speech, Vision)Graduação em Ciência da Computação, Engenharia, Matemática, Estatística ou áreas correlatasExperiência mínima de 4 anos com engenharia de dados e/ou machine learningExperiência com infraestrutura como código (Terraform, Bicep, ARM Templates)Domínio de práticas de DevOps/MLOps, CI/CD com Azure DevOps ou GitHub ActionsConhecimento em containers (Docker, Kubernetes, AKS)Inglês técnico avançado para documentação e reuniõesVamos ficar feliz se você tiver (seu diferencial):Certificações Azure: DP-203 (Data Engineer), AI-102 (AI Engineer), DP-100 (Data Scientist), AZ-305 (Solutions Architect)Certificação Databricks (Data Engineer Associate/Professional)Mestrado ou Doutorado em áreas relacionadas à IA/ML ou Engenharia de DadosExperiência com Semantic Kernel, LangChain ou frameworks de orquestração de LLMsExperiência com Microsoft FabricConhecimento em dbt (data build tool) para transformaçõesContribuições em projetos open source ou publicações na áreaNossos benefícios:Vale refeição;Vale alimentação;Vale combustível;Plano de saúde;Plano odontológico;Seguro de vida;Auxílio Creche;Auxílio crianças com deficiência;Convênio Farmácia;PLR;TotalPass;Integra (Programa Qualidade de Vida);Trabalho Híbrido.Apoio a certificações;Day off no mês do seu aniversário;#VemPraENG



  • Rio de Janeiro, Brasil Engineering Brasil Tempo inteiro

    Buscamos um(a) profissional para atuar na interseção entre Engenharia de Dados e Inteligência Artificial na plataforma Microsoft Azure. O(a) candidato(a) ideal será responsável por construir a infraestrutura de dados moderna que alimenta soluções de Machine Learning e IA Generativa, desde a ingestão e transformação de dados até a implantação de...


  • Rio de Janeiro, Brasil Engineering Brasil Tempo inteiro

    Buscamos um(a) profissional para atuar na interseção entre Engenharia de Dados e Inteligência Artificial na plataforma Microsoft Azure. O(a) candidato(a) ideal será responsável por construir a infraestrutura de dados moderna que alimenta soluções de Machine Learning e IA Generativa, desde a ingestão e transformação de dados até a implantação de...

  • Engenheiro ML

    3 semanas atrás


    Rio de Janeiro, Brasil BairesDev Tempo inteiro

    Há mais de 15 anos, a BairesDev® é líder em projetos tecnológicos. Entregamos soluções inovadoras para gigantes como Google e Rolls-Royce e as startups mais inovadoras do Vale do Silício. Temos uma equipe diversa de mais de 4.000 profissionais formada pelo Top 1% dos talentos de tecnologia do mundo, trabalhando remotamente em cargos de impacto...


  • Rio de Janeiro, Brasil Innolevels Tempo inteiro

    Estamos contratando Engenheiro de Machine LearningHome OfficeRequisitos:• Python• Apache Spark / PySpark• SQL• Construção de pipelines de ML em produção (treino, inferência e re-treino)• APIs de inferência para modelos de Machine Learning• CI/CD aplicado a projetos de dados e ML• Monitoramento e observabilidade de modelos (dados,...

  • Engenheiro de Dados

    Há 3 dias


    Região Geográfica Intermediária de São Paulo, Brasil Grupo Bolt Tempo inteiro

    Overview Vaga: Engenheiro(a) de Dados Sênior – IA / MLOps / Feature Engineering / RAG (AWS). Estamos buscando um(a) Engenheiro(a) de Dados Sênior para atuar no core da nossa plataforma de Inteligência Artificial, sendo responsável por Data Lakes, Feature Engineering, pipelines de MLOps e construção de RAGs, viabilizando Machine Learning e IA...


  • Rio de Janeiro, Brasil Innolevels Tempo inteiro

    Estamos contratando Engenheiro de Machine Learning Home Office Requisitos:• Python • Apache Spark / PySpark• SQL• Construção de pipelines de ML em produção (treino, inferência e re-treino)• APIs de inferência para modelos de Machine Learning• CI/CD aplicado a projetos de dados e ML• Monitoramento e observabilidade de modelos (dados,...


  • Rio de Janeiro, Brasil innolevels Tempo inteiro

    Overview Estamos contratando Engenheiro de Machine Learning. Home Office. Requisitos Python Apache Spark / PySpark SQL Construção de pipelines de ML em produção (treino, inferência e re-treino) APIs de inferência para modelos de Machine Learning CI/CD aplicado a projetos de dados e ML Monitoramento e observabilidade de modelos (dados, performance e...


  • Rio de Janeiro, Rio de Janeiro, Brasil innolevels - Leveraging your Business Tempo inteiro

    Estamos contratando Engenheiro de Machine Learning Home Office Requisitos: • Python • Apache Spark / PySpark • SQL • Construção de pipelines de ML em produção (treino, inferência e re-treino) • APIs de inferência para modelos de Machine Learning • CI/CD aplicado a projetos de dados e ML • Monitoramento e observabilidade de modelos (dados,...


  • Rio de Janeiro, Brasil Innolevels Tempo inteiro

    Estamos contratando Engenheiro de Machine LearningHome OfficeRequisitos:• Python• Apache Spark / PySpark• SQL• Construção de pipelines de ML em produção (treino, inferência e re-treino)• APIs de inferência para modelos de Machine Learning• CI/CD aplicado a projetos de dados e ML• Monitoramento e observabilidade de modelos (dados,...


  • Rio de Janeiro, Brasil innolevels Tempo inteiro

    Estamos contratando Engenheiro de Machine Learning Home Office Requisitos Python Apache Spark / PySpark SQL Construção de pipelines de ML em produção (treino, inferência e re-treino) APIs de inferência para modelos de Machine Learning CI/CD aplicado a projetos de dados e ML Monitoramento e observabilidade de modelos (dados, performance e drift)...