shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Comparar dois arquivos gigantes


From: allan_hkrs
Subject: Re: Comparar dois arquivos gigantes
Date: Fri, 03 Jun 2011 14:49:37 -0000
User-agent: eGroups-EW/0.82

Julio, obrigado pela resposta.
Como o comando já estava executando a 2 dias fiz de um jeito meio "esdrúxulo" 
para calcular o tempo, usei o comando time para medir 1 comparação e assim fui 
fazendo calculos (multiplique por 87 mil, depois calculei os segundos.. horas.. 
e assim foi).

Obrigado por me responder, vou tentar utilizar os dois métodos, engraçado que 
com o fgrep ele não me retornou nada já de cara, procurei no man mas não axei, 
existe algum modo "verbose" para o fgrep? para que eu saiba o q ele fez...

Vou procurar sobre esse cmd... obrigado pela ajuda.. quem quiser ajudar ae 
sinta-se a vontade.

--- Em address@hidden, "Julio C. Neves" <julio.neves@...> escreveu
>
> Pergunta: como vc chegou à conclusão que o egrep demorará 18 dias?
> 
> Para acelerar tenho 2 propostas:
> 1 - grep -F -f arquivo87mil.txt arquivo2mil.txt
> o egrep (ou grep -E) é o grep mais lento que existe o fgrep (ou grep -F como
> usei) é o mais rápido e é o indicado, qdo não se usa expressões regulares na
> pesquisa.
> 
> 2 - cmd comm
> O problema é que não sei de cor as opções deste cmd, mas tem opção para
> tudo: simplesmente para comparar; para listar somente o que contém num que
> não contém noutro; o que contém noutro que não contém num; o que contém num
> e noutro, ...
> 
> Cordialmente,
> 
> Julio Neves
> 
> *Quer programar bem em Shell?*
> 
> *Use este endereço de e-mail, o Skype ou ☎ (21)8112-9988 ☎*
> My profiles: [image: Twitter] <http://twitter.com/juliobash>
> Contact me: [image: Skype] julioneves1
> 
> 
> Em 3 de junho de 2011 11:26, allan_hkrs <allan_hkrs@...> escreveu:
> 
> >
> >
> > Pessoal, sei que o grupo até não envolve o assunto que vou tratar, mas
> > gostaria de pedir ajuda porque sei que vocês aqui manjam muito.
> >
> > Me defrontei hoje com uma situação não muito comum. Preciso comparar no
> > shell dois arquivos texto (até aí tudo bem, faço isso rotineiramente).
> > A questão é que um arquivo possui 87059 linhas e tenho que procurar cada
> > linha dentro um arquivo de 2200 linhas, ou seja, procurar comparar cada
> > linha das 87 mil com cada linha das 2200.
> >
> > Estava tentando fazer isso da seguinte maneira:
> >
> > egrep -f arquivo87mil.txt arquivo2mil.txt
> >
> > Só que dessa maneira segundo meus cálculos o resultado irá demorar
> > absuradamente para ser gerado (cerca de 18 dias). A questão é... existe
> > alguma outra forma de se fazer isso que seja melhor (num tempo viável)?
> >
> > Pensei em usar o awk ou mesmo fazer um programa em C... mas antes de
> > estourar os miolos vim perguntar aos mestres dos magos... kkkkk
> >
> > Grato.
> > Allan.
> >
> >  
> >
> 
> 
> [As partes desta mensagem que não continham texto foram removidas]
>




reply via email to

[Prev in Thread] Current Thread [Next in Thread]