Intermediário 3–5 dias
Pipeline ETL automatizado
Um ETL de verdade: extrai de uma fonte, transforma com Polars, carrega num DuckDB e orquestra com agendamento. Base da engenharia de dados.
PolarsDuckDBPrefect
Construa este projeto na PyTrack
Acesse o passo a passo guiado, exercícios e a IDE Python no navegador.
Começar grátisO que você vai construir
- ✓Extração de múltiplas fontes
- ✓Transformações com Polars (rápido)
- ✓Carga em DuckDB/Parquet
- ✓Orquestração e retries
- ✓Logs e validação de qualidade
Passo a passo
- 1
Defina as fontes e o schema final
- 2
Extraia os dados brutos
- 3
Transforme e valide com Polars
- 4
Carregue em DuckDB/Parquet
- 5
Orquestre com Prefect
- 6
Adicione alertas de falha
O que você vai aprender
ETL/ELTOrquestraçãoQualidade de dados