
- Employment
- Pj
About the role
O que é a Base/labs:
A Base/labs é o braço de IA e automação da BASE2 — empresa com mais de 21 anos entregando tecnologia que funciona para empresas brasileiras e globais.
A BASE2 foi fundada há mais de 21 anos em Belo Horizonte e se tornou referência em desenvolvimento de software, automação e integração de sistemas para grandes empresas brasileiras. A Base/labs nasce como o braço especializado em IA aplicada e automação inteligente — combinando a experiência sólida da BASE2 com as tecnologias mais avançadas de inteligência artificial disponíveis.
Nossa missão é direta: tornar IA acessível e rentável para empresas de todos os portes. Não vendemos tecnologia por tecnologia — entregamos resultado mensurável.
Faça parte deste time!
Estamos compondo um time para um projeto de construção de um Data Lake na stack AWS. Buscamos um(a) Engenheiro(a) de Dados para entrar produzindo desde o primeiro dia, acelerando o desenvolvimento dos pipelines e das camadas analíticas.
Responsabilidades
- Desenvolver e manter pipelines de transformação de dados em larga escala utilizando Apache Spark / PySpark.
- Construir e manter as camadas de refinamento do Data Lake (raw → tratada → analítica) sobre a stack AWS.
- Otimizar consultas, particionamento e processamento de grandes volumes de dados em batch.
- Garantir qualidade, consistência e rastreabilidade dos dados, com testes e validações automatizadas.
- Apoiar troubleshooting e resolução de incidentes em pipelines.
- Colaborar com os times de Analytics, BI e Engenharia.
Requisitos obrigatórios
- SQL avançado.
- Python para desenvolvimento de pipelines e transformações.
- Apache Spark e PySpark aplicados a processamento batch de grandes volumes.
- AWS: S3, Glue, IAM e Athena.
- Arquitetura de Data Lake / Lakehouse e o conceito de camadas de refinamento de dados (raw, tratada e analítica — Bronze/Silver/Gold).
- Modelagem dimensional para a camada analítica.
Requisitos Desejáveis:
- dbt, Airbyte e orquestração (Airflow, Dagster ou similares).
- AWS adicionais: EMR e Lambda.
- Apache Iceberg ou Delta Lake.
- CI/CD para dados e observabilidade de pipelines.
A Base/labs é uma empresa que trabalha com oportunidades de carreira, independente de gênero, orientação sexual, religião, deficiência e não há lugar para qualquer tipo de discriminação entre nós.
Se o seu perfil corresponde ao que acreditamos, venha fazer parte do nosso time!
723,000+ hidden jobs like this
Base2 and thousands of companies post here first — often days before LinkedIn or Indeed. Your first 5 applications are free; go Pro to apply without limits.
Everything Pro unlocks:
- Unlimited applications — free stops at 5
- Track every application in one place
- Apply straight to the source, one click
- Save & organize roles you love
- Roles pulled from company boards before the big sites