[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Comparar dois arquivos gigantes
From: |
Julio C. Neves |
Subject: |
Re: [shell-script] Comparar dois arquivos gigantes |
Date: |
Fri, 3 Jun 2011 11:40:31 -0300 |
O man do comm é muito fraco. Veja o histórico da lista que tem muito mais
informação.
Cordialmente,
Julio Neves
*Quer programar bem em Shell?*
*Use este endereço de e-mail, o Skype ou ☎ (21)8112-9988 ☎*
My profiles: [image: Twitter] <http://twitter.com/juliobash>
Contact me: [image: Skype] julioneves1
Em 3 de junho de 2011 11:33, Leslie Watter <address@hidden> escreveu:
> Oi Allan,
>
> Eu tentaria usar o comm que faz a comparação dos arquivos, tirado da
> manpage
> do comm:
>
> -----
> COMM(1) User
> Commands
> COMM(1)
>
> NAME
> comm - compare two sorted files line by line
>
> SYNOPSIS
> comm [OPTION]... FILE1 FILE2
>
> DESCRIPTION
> Compare sorted files FILE1 and FILE2 line by line.
> ----
>
> Tenta usar o comm ;-)
>
> por exemplo:
>
> leslie@mione:~$ man comm > /tmp/a
> leslie@mione:~$ man comm > /tmp/b
> leslie@mione:~$ echo 'fin' >> /tmp/b
> leslie@mione:~$ comm -3 <(sort /tmp/a) <(sort /tmp/b)
> fin
> leslie@mione:~$
>
> []s
>
> LEslie
>
>
> 2011/6/3 allan_hkrs <address@hidden>
>
> >
> >
> > Pessoal, sei que o grupo até não envolve o assunto que vou tratar, mas
> > gostaria de pedir ajuda porque sei que vocês aqui manjam muito.
> >
> > Me defrontei hoje com uma situação não muito comum. Preciso comparar no
> > shell dois arquivos texto (até aí tudo bem, faço isso rotineiramente).
> > A questão é que um arquivo possui 87059 linhas e tenho que procurar cada
> > linha dentro um arquivo de 2200 linhas, ou seja, procurar comparar cada
> > linha das 87 mil com cada linha das 2200.
> >
> > Estava tentando fazer isso da seguinte maneira:
> >
> > egrep -f arquivo87mil.txt arquivo2mil.txt
> >
> > Só que dessa maneira segundo meus cálculos o resultado irá demorar
> > absuradamente para ser gerado (cerca de 18 dias). A questão é... existe
> > alguma outra forma de se fazer isso que seja melhor (num tempo viável)?
> >
> > Pensei em usar o awk ou mesmo fazer um programa em C... mas antes de
> > estourar os miolos vim perguntar aos mestres dos magos... kkkkk
> >
> > Grato.
> > Allan.
> >
> >
> >
>
>
>
> --
> Leslie H. Watter
>
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
> ------------------------------------
>
> ---------------------------------------------------------------------
> Esta lista não admite a abordagem de outras liguagens de programação, como
> perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio
> aviso.
> ---------------------------------------------------------------------
> Sair da lista: address@hidden
> ---------------------------------------------------------------------
> Esta lista é moderada de acordo com o previsto em
> http://www.listas-discussao.cjb.net
> ---------------------------------------------------------------------
> Servidor Newsgroup da lista: news.gmane.org
> Grupo: gmane.org.user-groups.programming.shell.brazil
>
> Links do Yahoo! Grupos
>
>
>
[As partes desta mensagem que não continham texto foram removidas]