shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Re: Comparar dois arquivos gigantes


From: William Alves dos Santos
Subject: Re: [shell-script] Re: Comparar dois arquivos gigantes
Date: Fri, 3 Jun 2011 11:57:21 -0300

Caros,

Para ajudar e entender melhor, eu executo comparações com mais de 60 milhões
de registros, e funciona bem sim, para mim no começo também foi assustador
essa quantidade, eu até então trabalhava com no máximo 8 milhões e também
achava assustador.


Abraços

*William Alves dos Santos*
**Cel.: +55 (11) 6835 8172

 <address@hidden> <http://www.proatividadeweb.com>


Em 3 de junho de 2011 11:49, allan_hkrs <address@hidden> escreveu:

>
>
> Julio, obrigado pela resposta.
> Como o comando já estava executando a 2 dias fiz de um jeito meio
> "esdrúxulo" para calcular o tempo, usei o comando time para medir 1
> comparação e assim fui fazendo calculos (multiplique por 87 mil, depois
> calculei os segundos.. horas.. e assim foi).
>
> Obrigado por me responder, vou tentar utilizar os dois métodos, engraçado
> que com o fgrep ele não me retornou nada já de cara, procurei no man mas não
> axei, existe algum modo "verbose" para o fgrep? para que eu saiba o q ele
> fez...
>
> Vou procurar sobre esse cmd... obrigado pela ajuda.. quem quiser ajudar ae
> sinta-se a vontade.
>
> --- Em address@hidden, "Julio C. Neves" <julio.neves@...>
> escreveu
>
> >
> > Pergunta: como vc chegou à conclusão que o egrep demorará 18 dias?
> >
> > Para acelerar tenho 2 propostas:
> > 1 - grep -F -f arquivo87mil.txt arquivo2mil.txt
> > o egrep (ou grep -E) é o grep mais lento que existe o fgrep (ou grep -F
> como
> > usei) é o mais rápido e é o indicado, qdo não se usa expressões regulares
> na
> > pesquisa.
> >
> > 2 - cmd comm
> > O problema é que não sei de cor as opções deste cmd, mas tem opção para
> > tudo: simplesmente para comparar; para listar somente o que contém num
> que
> > não contém noutro; o que contém noutro que não contém num; o que contém
> num
> > e noutro, ...
> >
> > Cordialmente,
> >
> > Julio Neves
> >
> > *Quer programar bem em Shell?*
> >
> > *Use este endereço de e-mail, o Skype ou ☎ (21)8112-9988 ☎*
>
> > My profiles: [image: Twitter] <http://twitter.com/juliobash>
> > Contact me: [image: Skype] julioneves1
> >
> >
> > Em 3 de junho de 2011 11:26, allan_hkrs <allan_hkrs@...> escreveu:
>
> >
> > >
> > >
> > > Pessoal, sei que o grupo até não envolve o assunto que vou tratar, mas
> > > gostaria de pedir ajuda porque sei que vocês aqui manjam muito.
> > >
> > > Me defrontei hoje com uma situação não muito comum. Preciso comparar no
> > > shell dois arquivos texto (até aí tudo bem, faço isso rotineiramente).
> > > A questão é que um arquivo possui 87059 linhas e tenho que procurar
> cada
> > > linha dentro um arquivo de 2200 linhas, ou seja, procurar comparar cada
> > > linha das 87 mil com cada linha das 2200.
> > >
> > > Estava tentando fazer isso da seguinte maneira:
> > >
> > > egrep -f arquivo87mil.txt arquivo2mil.txt
> > >
> > > Só que dessa maneira segundo meus cálculos o resultado irá demorar
> > > absuradamente para ser gerado (cerca de 18 dias). A questão é... existe
> > > alguma outra forma de se fazer isso que seja melhor (num tempo viável)?
> > >
> > > Pensei em usar o awk ou mesmo fazer um programa em C... mas antes de
> > > estourar os miolos vim perguntar aos mestres dos magos... kkkkk
> > >
> > > Grato.
> > > Allan.
> > >
> > >
> > >
> >
> >
> > [As partes desta mensagem que não continham texto foram removidas]
> >
>
>  
>


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]