|
From: | phfbettega |
Subject: | Re: [shell-script] Re: Obter informações de um a rquivo HTML (Shell Script) |
Date: | Thu, 14 Jul 2016 19:33:36 -0300 |
User-agent: | Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Thunderbird/45.2.0 |
Olá itamar, pensei a mesma coisa. Se o andrelucio puder pegar essa tabela com lynx ou outro seria bem mais fácil, a informaçao sairia toda em uma linha. Filtrei com sed mas acho que dá pra simplificar rs sed -nr '/user\.server[0-9]+/ { :a s/<[^>]+>// s/^[[:blank:]]+// s/[[:blank:]]+$// H n s/<\/tr>// tprint ba :print x s/^[^a-z]+// s/(\n)+/\t/g s/\t$// p}' arq-html user.server1 200.50.222.333:51808 10.255.1.1 Mon Jun 6 07:36:15 2000 user.server2 200.50.222.444:45026 10.255.1.2 Sun Jun 5 02:35:51 2000 Uma coisa que não entendi é que antes eu fiz com o comando g no lugar de x, no loop pra imprimir a saída. Desse jeito a primeira linha sai duplicada, e a outra linha com user.server[0-9] sai grudada com um tab. Procurei o erro mas não consegui achar. user.server1 200.50.222.333:51808 10.255.1.1 Mon Jun 6 07:36:15 2000user.server1 200.50.222.333:51808 10.255.1.1 Mon Jun 6 07:36:15 2000user.server2 200.50.222.444:45026 10.255.1.2 Sun Jun 5 02:35:51 2000
sed ... :print;g; ... | cat -vet user.server1^I200.50.222.333:51808^I10.255.1.1^IMon Jun 6 07:36:15 2000$user.server1^I200.50.222.333:51808^I10.255.1.1^IMon Jun 6 07:36:15 2000^Iuser.server2^I200.50.222.444:45026^I10.255.1.2^ISun Jun 5 02:35:51 2000$
Abraços Paulo Bettega On 14-07-2016 19:10, address@hidden [shell-script] wrote:
Caro amigo Sua pedida é bem limitada e o arquivo de exemplo em si não ajuda muito. Precisa dizer o que quer com mais detalhes, que tipo de dados quer em cada caso. Por exemplo, vc pode usar browsers em modo texto que deixariam com uma saída limpa, como lynx, links, elinks e w3m. Mas assim perderia a informação dos atributos dentro das tags e nesse o caso não é recomendado usar esses browsers se precisar dessa informação especificamente. De outra forma usar grep, sed, awk e os muitos builtins do bash é o caminho. Detalhe mais sua necessidade, só pelo que foi dito é difícil direcionar. []'s Itamar
[Prev in Thread] | Current Thread | [Next in Thread] |