Skip to content

Jorgeotero1998/Scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Scraper de Jurisprudencia

Solución robusta y escalable para la extracción automatizada de datos jurisprudenciales, el scraper principal (OEFA) fue implementado con HTTP puro y Cheerio. Para el portal del Poder Judicial de Perú, que requiere VPN, se implementó una solución alternativa con Playwright como fallback durante el desarrollo.


🚀 Arquitectura

El sistema ha sido diseñado para interactuar directamente con el ciclo de vida de los servicios JSF (JavaServer Faces) mediante:

  • HttpClient personalizado: Implementa reintentos con Backoff Exponencial para mitigar errores 429 (Rate Limiting).
  • Parser de DOM (Cheerio): Extracción eficiente y de bajo consumo de recursos sin sobrecarga de renderizado.
  • Persistencia Multi-formato: Exportación automática a JSON para consumo de datos y CSV para análisis estadístico.

📋 Requisitos Previos

  • Node.js: v18 o superior.
  • Gestor de paquetes: npm.
  • Conexión: VPN requerida para el portal..

⚙️ Instalación

  1. Clonar el repositorio:
   git clone [https://github.com/Jorgeotero1998/Scraper.git](https://github.com/Jorgeotero1998/Scraper.git)
   cd Scraper

About

Challenge

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors