Novidade: app desktop disponivel!
Todos os projetos
Desafio 3–5 semanas

Pipeline de dados em tempo real

Engenharia de dados em escala: ingestão por streaming, processamento distribuído com Spark e um lakehouse versionado.

KafkaPySparkAirflowDelta Lake

Construa este projeto na PyTrack

Acesse o passo a passo guiado, exercícios e a IDE Python no navegador.

Começar grátis

O que você vai construir

  • Ingestão em streaming (Kafka)
  • Processamento com PySpark
  • Lakehouse com Delta Lake
  • Orquestração com Airflow
  • Qualidade e governança

Passo a passo

  1. 1

    Configure o produtor/consumidor Kafka

  2. 2

    Processe streams com PySpark

  3. 3

    Escreva em Delta Lake (ACID)

  4. 4

    Orquestre batches com Airflow

  5. 5

    Adicione data quality

  6. 6

    Monitore o pipeline

O que você vai aprender

StreamingSpark distribuídoLakehouse

Pronto para construir seu portfólio? Python

Crie sua conta gratuita e tenha acesso a trilhas, exercícios, projetos e um dashboard que mostra sua evolução de verdade.