shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Obter informações de um a rquivo HTML (Shell Script)


From: itamarnet
Subject: Re: Obter informações de um a rquivo HTML (Shell Script)
Date: 15 Jul 2016 05:29:12 -0700

Caro Andre
Nosso colega Paulo Bettega deu uma sugestão usando sed, que pode ser usado caso não tenha um browser em modo texto disponível, mas se tiver pode usar:
lynx:
lynx -dump -nolist arquivo_baixado.html | awk '{ print $1, $3 }'

links: ( ach que também serve para o elinks)
links -dump arquivo_baixado.html | awk '{ print $1, $3 }'

w3m:
w3m -dump -T text/html arquivo_baixado.html | awk '{ print $1, $3 }'

Ou pode agregar o awk final nos exemplos acima, na sequência que o Paulo demostrou antes.

Dependendo da forma como cada navegador interpreta a página, talvez precise trocar a parte do awk por:
awk '{ print $2, $4 }'

Mas é necessário testar cada situação.


Outra coisa que pode considerar, que ao invés de baixar a página como um arquivo, esses navegadores podem consultar diretamente a url, que aliás é a função mais natural deles e nesse caso troque o termo "arquivo_baixado.htm" pela url que usa, e eles tem mecanismos de autenticação embutidos, apenas consulte a documentação sobre a forma que cada um faz isso, se for necessário.


[]'s
Itamar

reply via email to

[Prev in Thread] Current Thread [Next in Thread]