
- Employment
- Clt
About the role
Responsável pela coleta de dados e armazenamento, limpeza e pré-processamento dos dados, desenvolvimento e manutenção de pipelines e qualidade dos dados disponibilizados no sistema.
1. Conhecimento/Domínio Tecnologias SAS
- Programação em SAS Base, SAS Macro e SAS Guide para manipulação
de dados.
- SAS/ACCESS para integração com bancos de dados.
2. Expertise em Databricks
- Desenvolvimento de pipelines de dados no Databricks Lakehouse
Platform.
- Programação em PySpark e Spark SQL para processamento distribuído.
- Otimização de clusters e jobs no Databricks Runtime.
- Integração com Delta Lake para gestão de dados em formato aberto.
3. Linguagens de Programação e Bancos de Dados
- SQL avançado para consultas e modelagem de dados.
- Conhecimento em **Python** (Pandas, NumPy) para automação e
análise.
- Familiaridade com bancos de dados como PostgreSQL, SQL Server, ou
Oracle.
4. Engenharia de Dados e Cloud
- Construção de ETL/ELT eficientes.
- Conhecimento em Azure, AWS ou GCP (especialmente se usar
Databricks em cloud).
- Experiência com de orquestração como Workflows Databricks,
Control-M e Pipelines ADF .
5. Governança e Qualidade de Dados
- Implementação de práticas de **Data Governance**.
- Controle de metadados e documentação.
- Garantia de qualidade com validação e testes.
723,000+ hidden jobs like this
Nava and thousands of companies post here first — often days before LinkedIn or Indeed. Your first 5 applications are free; go Pro to apply without limits.
Everything Pro unlocks:
- Unlimited applications — free stops at 5
- Track every application in one place
- Apply straight to the source, one click
- Save & organize roles you love
- Roles pulled from company boards before the big sites