Engenheiro de Dados

Há 7 horas


Curitiba, Paraná, Brasil ARCA Mobility as a Service Tempo inteiro
Overview

Engenheiro de Dados para ARCA Mobility as a Service. O papel envolve estruturar a fundação de dados que alimenta nossa solução de precificação dinâmica e predição de ocupação com base em IA, usando modelos estatísticos e de machine learning aplicados a grandes volumes de dados históricos e contextuais.

Você será o elo crítico entre as fontes de dados das empresas de transporte e os modelos de IA, responsável por construir pipelines de dados resilientes, escaláveis e auditáveis, além de implementar práticas modernas de governança para garantir qualidade, segurança e disponibilidade dos dados para consumo analítico e preditivo.

Responsibilities
  • Projetar, implementar e manter pipelines de ETL/ELT para ingestão, transformação e disponibilização de dados de diversas fontes (APIs, bancos de dados, arquivos históricos, etc.).
  • Construir e manter o data lake e/ou data warehouse, organizando os dados de forma eficiente e acessível para os cientistas de dados e desenvolvedores.
  • Preparar datasets de treinamento e validação para os modelos preditivos, com foco na qualidade, consistência e rastreabilidade dos dados.
  • Participar ativamente da implantação e manutenção de uma feature store, viabilizando o reuso e versionamento de features para machine learning.
  • Colaborar com cientistas de dados e engenheiros de machine learning para operacionalizar modelos em produção com dados atualizados em tempo real.
  • Garantir boas práticas de governança de dados, incluindo limpeza, anonimização, versionamento e atualizações incrementais.
  • Automatizar processos de ingestão e transformação com ferramentas modernas como Apache Airflow, Apache Spark ou equivalentes.
  • Trabalhar com armazenamento em nuvem (como AWS S3, Google Cloud Storage, BigQuery, Redshift) para garantir escalabilidade e performance dos fluxos de dados.
Qualifications
  • Sólida experiência com ETL/ELT, usando ferramentas como Apache Airflow, Spark, dbt ou similares.
  • Domínio em modelagem de dados, tanto relacional (SQL) quanto orientada a dados analíticos.
  • Experiência com armazenamento em nuvem e arquitetura de dados em ambientes como AWS (S3, Glue, Redshift), GCP (BigQuery, Cloud Storage) ou Azure.
  • Experiência em limpeza, normalização e versionamento de dados, além de estratégias de atualização incremental.
  • Experiência com pipelines de dados para projetos de machine learning, como preparação de features, join de múltiplas fontes, e atualização de dados em produção.
  • Prática com ferramentas de orquestração, agendamento e monitoramento de processos.
  • Experiência prévia com feature stores e sistemas de MLOps.
  • Conhecimento em programação com Python ou Scala, voltada a manipulação de dados.
  • Graduação completa em Engenharia (Computação, Mecânica, Dados, Ciência de Dados, Sistemas de Informação ou áreas afins).
Job Details
  • Nível : Especialista
  • Tipo de contrato : CLT
  • Jornada de trabalho : De segunda à sexta, das 09h às 18h
About the Company

Somos uma empresa de tecnologia especializada em soluções para o segmento transporte Rodoviário e Mobilidade. Nosso propósito é conectar origens a destinos, ajudando na decisão de mobilidade das pessoas. Na Embarca, estamos avançando com o projeto SIPPO, um conjunto de algoritmos para o setor de transporte rodoviário no Brasil.

Application

Candidate-se pelo email:

#J-18808-Ljbffr
  • Engenheiro De Dados

    2 semanas atrás


    Curitiba, Paraná, Brasil Ewave do Brasil Tempo inteiro

    Você fará parte de um dos capítulos de Engenheiros de Dados em Curitiba-PR, Brasil, integrante da comunidade global de Engenheiros de Dados da função Digital & IT Data. Além disso, atuará no desenvolvimento de soluções de dados em um time dentro da área de Analytics & BI – Produto de Dados. Requisitos obrigatórios:Formação acadêmica em uma...

  • Engenheiro de Dados

    2 semanas atrás


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    3 semanas atrás


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    3 semanas atrás


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    3 semanas atrás


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    Há 3 dias


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    2 semanas atrás


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro de Dados

    Há 9 horas


    Curitiba, Paraná, Brasil Blend It Consultoria Tempo inteiro

    RequisitosPelo menos 5 anos de experiência como engenheiro de dadosExperiência com DatabricksExperiência na implementação da arquitetura de dados Medallion. Conhecimento profundo de stacks de engenharia de dados do Azure, Data Factory, Data Lake Storage e Synapse. Sólida experiência com Databricks e linguagens de script como Spark SQL e PySpark....

  • Engenheiro De Dados

    3 semanas atrás


    Curitiba, Paraná, Brasil Ewave do Brasil Tempo inteiro

    Você fará parte de um dos capítulos de Engenheiros de Dados em Curitiba-PR, Brasil, integrante da comunidade global de Engenheiros de Dados da função Digital & IT Data. Além disso, atuará no desenvolvimento de soluções de dados em um time dentro da área de Analytics & BI – Produto de Dados.Requisitos obrigatórios:- Formação acadêmica em uma...

  • Engenheiro de dados

    3 semanas atrás


    Curitiba, Paraná, Brasil Ewave do Brasil Tempo inteiro

    Você fará parte de um dos capítulos de Engenheiros de Dados em Curitiba-PR, Brasil, integrante da comunidade global de Engenheiros de Dados da função Digital & IT Data. Além disso, atuará no desenvolvimento de soluções de dados em um time dentro da área de Analytics & BI – Produto de Dados. Requisitos obrigatórios: Formação acadêmica em...