[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Comparar dois arquivos gigantes
From: |
William Alves dos Santos |
Subject: |
Re: [shell-script] Comparar dois arquivos gigantes |
Date: |
Fri, 3 Jun 2011 11:52:09 -0300 |
Caro,
Isso faz parte do meu dia a dia, só que com arquivos muito maiores.
A dica, os arquivos devem estar organizados, ou seja um *sort *resolve isso
em ambos, depois é o *join.
*É importante que tente desenvolver, se precisar de ajuda retorna aqui.*
*
Abraços
*William Alves dos Santos*
**Cel.: +55 (11) 6835 8172
<address@hidden> <http://www.proatividadeweb.com>
Em 3 de junho de 2011 11:26, allan_hkrs <address@hidden> escreveu:
>
>
> Pessoal, sei que o grupo até não envolve o assunto que vou tratar, mas
> gostaria de pedir ajuda porque sei que vocês aqui manjam muito.
>
> Me defrontei hoje com uma situação não muito comum. Preciso comparar no
> shell dois arquivos texto (até aí tudo bem, faço isso rotineiramente).
> A questão é que um arquivo possui 87059 linhas e tenho que procurar cada
> linha dentro um arquivo de 2200 linhas, ou seja, procurar comparar cada
> linha das 87 mil com cada linha das 2200.
>
> Estava tentando fazer isso da seguinte maneira:
>
> egrep -f arquivo87mil.txt arquivo2mil.txt
>
> Só que dessa maneira segundo meus cálculos o resultado irá demorar
> absuradamente para ser gerado (cerca de 18 dias). A questão é... existe
> alguma outra forma de se fazer isso que seja melhor (num tempo viável)?
>
> Pensei em usar o awk ou mesmo fazer um programa em C... mas antes de
> estourar os miolos vim perguntar aos mestres dos magos... kkkkk
>
> Grato.
> Allan.
>
>
>
[As partes desta mensagem que não continham texto foram removidas]