shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Bulk] Re: [shell-script] Re: recuperar textos multiplos da mesma li


From: Robson Alexandre
Subject: Re: [Bulk] Re: [shell-script] Re: recuperar textos multiplos da mesma linha (SED)
Date: Sat, 18 Oct 2014 18:53:31 -0300

Bacana Sidney,
por isso que sempre digo que "Se a única ferramenta que você tem é um martelo, você tende a ver todo problema como um prego."


Atenciosamente
Robson Alexandre

Em 18 de outubro de 2014 17:15, Sidney Souza address@hidden [shell-script] <address@hidden> escreveu:
 

Petterson,

Consegui resolver o seu problema com o seguinte comando:

$ grep -oP "(?<=cdcargo=)\d+" file.html | uniq

Como o seu arquivo é remoto, basta substituir o nome do arquivo, file.html, pelo comando curl ou wget -O - URL.



2014-10-18 15:47 GMT-03:00 Robson Alexandre address@hidden [shell-script] <address@hidden>:

 

Petterson,

acredito que vc consiga fazer desta forma (sem especificação de linha, nem "tail", "head", "cat arquivo | grep qqcoisa")

$ baixa o arquivo para ARQUIVO
$ ids=$(sed -r -n "/cdcargo/{s/cdcargo=([^']*)'/\n\1\n/g;p}" ARQUIVO | grep -E "^[0-9]" | uniq)
$ echo "$ids"

Acho q somente com o sed usando os branches seja possível para retirar esses grep e uniq, ou talvez só o grep já estaria bem melhor.



Atenciosamente

Robson Alexandre

Em 18 de outubro de 2014 14:34, Petterson Faria address@hidden [shell-script] <address@hidden> escreveu:
 

A linha 740 que me interessa: http://pastebin.com/KNRZ5Qjs
Ai consegui o que queria manualmente assim:
  1. baixando com um cookie via "curl -c arquivo -b arquivo URL"
  2. filtro a linha 740 com:
    1. head -n740 ARQUIVO |tail -n1 > OUTPUT
  3. Ai fiz um "for" para quebrar em linhas pelos espaços
    1. for i in `cat 740.php`;do echo $i >> linhas.txt; done
  4. Depois peguei as linhas que tinha o que eu queria:
    1. cat linhas.txt |grep cdcarg >> cdcargos.txt
  5. Ai catei somente os IDs dos cargos que eh o que eu quero
    1. cat cdcargos.txt |cut -d'=' -f9|uniq > ids.txt




--
Atenciosamente,
Petterson Faria
"Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun Tzu)

2014-10-18 14:19 GMT-03:00 address@hidden [shell-script] <address@hidden>:
 

Assim é complicado ajudar, de um exemplo do arquivo de entrada e como deseja a saída para termos uma noção do que precisa


Esse códigos são atributos de uma tag? São o conteúdo de uma tag? O que deseja são id que vem logo na sequência ou após esse código pode haver algo antes do id?

Um exemplo com os cenários possíveis seriam de grande valia

[]'s
Itamar






reply via email to

[Prev in Thread] Current Thread [Next in Thread]