Solución robusta y escalable para la extracción automatizada de datos jurisprudenciales, el scraper principal (OEFA) fue implementado con HTTP puro y Cheerio. Para el portal del Poder Judicial de Perú, que requiere VPN, se implementó una solución alternativa con Playwright como fallback durante el desarrollo.
El sistema ha sido diseñado para interactuar directamente con el ciclo de vida de los servicios JSF (JavaServer Faces) mediante:
- HttpClient personalizado: Implementa reintentos con Backoff Exponencial para mitigar errores 429 (Rate Limiting).
- Parser de DOM (Cheerio): Extracción eficiente y de bajo consumo de recursos sin sobrecarga de renderizado.
- Persistencia Multi-formato: Exportación automática a JSON para consumo de datos y CSV para análisis estadístico.
- Node.js: v18 o superior.
- Gestor de paquetes:
npm. - Conexión: VPN requerida para el portal..
- Clonar el repositorio:
git clone [https://github.com/Jorgeotero1998/Scraper.git](https://github.com/Jorgeotero1998/Scraper.git)
cd Scraper