[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Grep
From: |
Julio Neves |
Subject: |
Re: [shell-script] Grep |
Date: |
Wed, 10 Oct 2001 11:21:44 -0300 |
Olá Laudelino,
não sou um especialista em expressões regulares e estou sem máquina para
testar as respostas, mas como estou lendo "Expressões Regulares - Guia de
Consulta Rápida" do Aurélio Marinho Jargas ( nosso colega da lista), que
estou achando IMPERDÍVEL, vou arriscar uma resposta. Tente:
egrep -v '^[1-9A-Za-z_]{0,5}$' Nome_Do_Arquivo > arqsaida
Se não funcionar tente:
sed '/^[1-9A-Za-z_]\{0,5\}$/' Nome_Do_Arquivo > arqsaida
Obs:
1 - Vc falou em 4 caracteres e colocou um com 5 (sex01) no seu exemplo.
Usei 5;
2 - Se houverem linhas vazias, elas tb serão removidas (para não fazê-lo
use {1,5});
3 - Colquei dentro dos colchetes os caracteres que achei que poderiam
aparecer. Caso existam outros, incluá-os (p. ex. [1-9A-Za-z_@].
Mestre Aurélio, espero não tê-lo decepcionado! :^)
[ ]s,
Julio
Favor responder a address@hidden
Para: <address@hidden>
cc:
Assunto: [shell-script] Grep
Tenho uma lista com 60.000 sites inúteis que vou usar no meu squid.
1 por linha.
Só Que.
tem alguns sites com nomes muito curtos tipo 4 caracteres que se confundem
com sites válidos
Tipo
0069
sex0
sex01
só que tem sites em que a url aparece essas letras
www.odia.com.br/materias/maio/diasemana-sex01/topicos.htm
www.odia.com.br/materias/maio/diasemana-sex02/topicos.htm
quero tirar do arquivo todas as linhas que tenham menos que 5 caracteres !
[As partes desta mensagem que não continham texto foram removidas]
Sair da lista: address@hidden
Banco Dados: http://www.egroups.com/group/shell-script
Seu uso do Yahoo! Grupos é sujeito às regras descritas em:
http://br.yahoo.com/info/utos.html
- Re: [shell-script] Grep,
Julio Neves <=