Skip to content

Latest commit

 

History

History
36 lines (30 loc) · 1.38 KB

File metadata and controls

36 lines (30 loc) · 1.38 KB

Básico de HTML/CSS e seletores xpath

  • Estrutura de um arquivo HTML
  • Tags básicas de HTML
  • Atributos de tags
  • querySelector e querySelectorAll
  • Seletores de CSS com BeautifulSoup

Requisições HTTP usando Python (Métodos e status codes)

  • Biblioteca requests
  • Métodos HTTP
  • Status codes e exemplos (https://http.cat/)
  • Texto de resposta
  • JSON de resposta
  • Headers de resposta

Como tornar uma requisição "mais humana" trocando user-agent e usando libs como hrequests

  • O que é user-agent
  • Requisições com hrequests

Como funciona a estrutura de uma página de notícia (meta tags e ld-json)

Como funciona a estrutura de um site: O que é o arquivo robots.txt, como achar e ler um sitemap

Como quebrar um captcha usando um browser headless

  • O que é um captcha
  • O que é um browser headless
  • Playwright e Stealth

Como lidar com paywalls de conteúdo

  • 12ft.io