Scraper de Jurisprudencia

Solución robusta y escalable para la extracción automatizada de datos jurisprudenciales, el scraper principal (OEFA) fue implementado con HTTP puro y Cheerio. Para el portal del Poder Judicial de Perú, que requiere VPN, se implementó una solución alternativa con Playwright como fallback durante el desarrollo.

🚀 Arquitectura

El sistema ha sido diseñado para interactuar directamente con el ciclo de vida de los servicios JSF (JavaServer Faces) mediante:

HttpClient personalizado: Implementa reintentos con Backoff Exponencial para mitigar errores 429 (Rate Limiting).
Parser de DOM (Cheerio): Extracción eficiente y de bajo consumo de recursos sin sobrecarga de renderizado.
Persistencia Multi-formato: Exportación automática a JSON para consumo de datos y CSV para análisis estadístico.

📋 Requisitos Previos

Node.js: v18 o superior.
Gestor de paquetes: npm.
Conexión: VPN requerida para el portal..

⚙️ Instalación

Clonar el repositorio:

   git clone [https://github.com/Jorgeotero1998/Scraper.git](https://github.com/Jorgeotero1998/Scraper.git)
   cd Scraper

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
src		src
.gitignore		.gitignore
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Scraper de Jurisprudencia

🚀 Arquitectura

📋 Requisitos Previos

⚙️ Instalación

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Scraper de Jurisprudencia

🚀 Arquitectura

📋 Requisitos Previos

⚙️ Instalación

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages