Skip to content

AndreBFarias/ScholarLens

Licença Python CI

ScholarLens

Ícone Acadêmico

Pipeline modular para buscas acadêmicas via SerpApi (Google Scholar). Coleta assíncrona de papers, formatação de resultados, extração de conteúdo e ranking por domínio e compartilhamentos. Útil para mapear tendências em publicações científicas.


Pré-requisitos

  • Python 3.10 ou superior
  • Chave SerpApi (gratuita até 100 buscas/mês em serpapi.com)

Instalação

git clone https://github.com/AndreBFarias/ScholarLens.git
cd ScholarLens
python3 -m venv .venv
source .venv/bin/activate
pip install -e ".[dev]"

Configuração

export SERPAPI_KEY="sua_chave_aqui"

Uso

# Formatação dos resultados já coletados
python -m scholarlens.formatacao

# Ranking
python -m scholarlens.ranking

Em scripts, use os módulos diretamente:

import asyncio
from scholarlens.coleta import main as coletar
asyncio.run(coletar(api_key, "inteligencia artificial regulatoria", num_pages=5))

Estrutura

ScholarLens/
  src/scholarlens/
    coleta.py        # Coleta assincrona via SerpApi
    extracao.py      # Extracao de conteudo HTML
    formatacao.py    # Normalizacao em DataFrame
    ranking.py       # Ranking por dominio
  tests/             # Testes pytest
  assets/            # Logo e recursos
  .github/workflows/ # CI
  pyproject.toml
  requirements.txt

Testes

pytest tests/ -v

Contribuição

Ver CONTRIBUTING.md e CODE_OF_CONDUCT.md.

Segurança

Ver SECURITY.md.

Licença

GPL v3 -- ver LICENSE.

About

Ferramenta open source em Python para buscas acadêmicas via SerpApi no Google Scholar, com coleta assíncrona, formatação, extração de conteúdo e ranking de domínios. Útil para mapear tendências em papers e citações, com foco em impactos sociais.

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages