Pipeline modular para buscas acadêmicas via SerpApi (Google Scholar). Coleta assíncrona de papers, formatação de resultados, extração de conteúdo e ranking por domínio e compartilhamentos. Útil para mapear tendências em publicações científicas.
- Python 3.10 ou superior
- Chave SerpApi (gratuita até 100 buscas/mês em serpapi.com)
git clone https://github.com/AndreBFarias/ScholarLens.git
cd ScholarLens
python3 -m venv .venv
source .venv/bin/activate
pip install -e ".[dev]"export SERPAPI_KEY="sua_chave_aqui"# Formatação dos resultados já coletados
python -m scholarlens.formatacao
# Ranking
python -m scholarlens.rankingEm scripts, use os módulos diretamente:
import asyncio
from scholarlens.coleta import main as coletar
asyncio.run(coletar(api_key, "inteligencia artificial regulatoria", num_pages=5))ScholarLens/
src/scholarlens/
coleta.py # Coleta assincrona via SerpApi
extracao.py # Extracao de conteudo HTML
formatacao.py # Normalizacao em DataFrame
ranking.py # Ranking por dominio
tests/ # Testes pytest
assets/ # Logo e recursos
.github/workflows/ # CI
pyproject.toml
requirements.txt
pytest tests/ -vVer CONTRIBUTING.md e CODE_OF_CONDUCT.md.
Ver SECURITY.md.
GPL v3 -- ver LICENSE.
