[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Comparar dois arquivos gigantes
From: |
allan_hkrs |
Subject: |
Comparar dois arquivos gigantes |
Date: |
Fri, 03 Jun 2011 14:26:30 -0000 |
User-agent: |
eGroups-EW/0.82 |
Pessoal, sei que o grupo até não envolve o assunto que vou tratar, mas gostaria
de pedir ajuda porque sei que vocês aqui manjam muito.
Me defrontei hoje com uma situação não muito comum. Preciso comparar no shell
dois arquivos texto (até aí tudo bem, faço isso rotineiramente).
A questão é que um arquivo possui 87059 linhas e tenho que procurar cada linha
dentro um arquivo de 2200 linhas, ou seja, procurar comparar cada linha das 87
mil com cada linha das 2200.
Estava tentando fazer isso da seguinte maneira:
egrep -f arquivo87mil.txt arquivo2mil.txt
Só que dessa maneira segundo meus cálculos o resultado irá demorar
absuradamente para ser gerado (cerca de 18 dias). A questão é... existe alguma
outra forma de se fazer isso que seja melhor (num tempo viável)?
Pensei em usar o awk ou mesmo fazer um programa em C... mas antes de estourar
os miolos vim perguntar aos mestres dos magos... kkkkk
Grato.
Allan.