Extraindo links de páginas com um simples código Javascript no console

Extraindo links de páginas com um simples código Javascript no console

  • Post author:
  • Post category:Geral

Fala pessoal,
fazia tempo que eu não escrevia aqui para o blog mas resolvi escrever esta dica por que eu precisei de algo parecido nesta semana.
Bom o cenário é o seguinte imagina que você precise extrair uma lista de links de uma determinada url e o servidor possui regras que impedem que você
execute múltiplas requests para isto.

Imaginando que os famosos Wget, Lynx, Curl ou Httrack sejam bloqueado para este tipo de ação então você pode utilizar uma navegação simples no seu próprio browser para isto.

var urls = document.getElementsByTagName('a');
for (url in urls) { console.log ( urls[url].href ); }