Intermediário 1–2 dias
Web scraper com exportação
Extraia dados estruturados de páginas web, limpe e exporte. Um clássico de automação que aparece muito no mercado.
httpxBeautifulSouppandas
Construa este projeto na PyTrack
Acesse o passo a passo guiado, exercícios e a IDE Python no navegador.
Começar grátisO que você vai construir
- ✓Coleta de múltiplas páginas (paginação)
- ✓Limpeza e normalização dos dados
- ✓Exportação para CSV e Excel
- ✓Respeito a robots.txt e rate limiting
Passo a passo
- 1
Inspecione o HTML do site-alvo
- 2
Baixe as páginas com httpx
- 3
Extraia os campos com BeautifulSoup
- 4
Trate paginação e dados ausentes
- 5
Limpe com pandas e exporte
- 6
(Bônus) Agende com cron
O que você vai aprender
Web scraping éticoManipulação de HTMLPandas para limpeza