[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Pesquisar string em arquivo pdf
From: |
Alexandre |
Subject: |
Re: [shell-script] Pesquisar string em arquivo pdf |
Date: |
Mon, 28 Mar 2011 08:42:07 -0300 |
Olá.
Tem o pdfgreep que fucniona como o greep.
http://pdfgrep.sourceforge.net/
Alexandre
Em 28 de março de 2011 00:12, Karin Klayton Schiochet <
address@hidden> escreveu:
>
>
> Pessoal,
>
> Gostaria de saber se existe algum programa ou comando que possa ler um
> arquivo pdf. A intenção é fazer um script que possa pesquisar no pdf por
> alguma string passada via linha de comando.
>
> Atualmente estou tentando usar o ps2txt para ler diretamente o
> arquivo.pdf e fazer uma pesquisa nele, porem não está dando muito certo.
> A intenção é inicialmente fazer algo do tipo ./script diretório
> "STRING_PESQUISADA".
>
> Se eu fizer diretamente no prompt de comando
> $ps2txt Linux_Shell_Commands.pdf | grep -n "Linux Shell Commands"
> 9:UNIX/Linux Shell Commands
>
> Ele me retorna o que pesquisei, mas em alguns arquivos que possuem
> imagem ele me retorna alguns warning e erros e não realiza a pesquisa
> correta no script.
>
> Segue o que eu tenho tentado fazer.
> #!/bin/bash
> #
> ARGS=2
> TEMP=temp.$$
> if [ "$#" -ne "$ARGS" ]
> then
> echo "Uso: `basename $0` diretório string"
> exit 1
> fi
>
> if [ ! -d "$1" ]
> then
> echo "Argumento "$1" não é um diretório válido"
> exit 1
> fi
>
> find $1 -type f -iname "*.pdf" >> "$TEMP"
> while read LINHA; do
> echo "Titulo: `basename "$LINHA"`"
> ps2txt -vi $LINHA | grep -n "$2"
>
> done < $TEMP
> rm "$TEMP"
>
> Atenciosamente,
> Karin Klayton Schiochet
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
[As partes desta mensagem que não continham texto foram removidas]