shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Pesquisar string em arquivo pdf


From: Alexandre
Subject: Re: [shell-script] Pesquisar string em arquivo pdf
Date: Mon, 28 Mar 2011 08:42:07 -0300

Olá.

Tem o pdfgreep que fucniona como o greep.

http://pdfgrep.sourceforge.net/


Alexandre


Em 28 de março de 2011 00:12, Karin Klayton Schiochet <
address@hidden> escreveu:

>
>
> Pessoal,
>
> Gostaria de saber se existe algum programa ou comando que possa ler um
> arquivo pdf. A intenção é fazer um script que possa pesquisar no pdf por
> alguma string passada via linha de comando.
>
> Atualmente estou tentando usar o ps2txt para ler diretamente o
> arquivo.pdf e fazer uma pesquisa nele, porem não está dando muito certo.
> A intenção é inicialmente fazer algo do tipo ./script diretório
> "STRING_PESQUISADA".
>
> Se eu fizer diretamente no prompt de comando
> $ps2txt Linux_Shell_Commands.pdf | grep -n "Linux Shell Commands"
> 9:UNIX/Linux Shell Commands
>
> Ele me retorna o que pesquisei, mas em alguns arquivos que possuem
> imagem ele me retorna alguns warning e erros e não realiza a pesquisa
> correta no script.
>
> Segue o que eu tenho tentado fazer.
> #!/bin/bash
> #
> ARGS=2
> TEMP=temp.$$
> if [ "$#" -ne "$ARGS" ]
> then
> echo "Uso: `basename $0` diretório string"
> exit 1
> fi
>
> if [ ! -d "$1" ]
> then
> echo "Argumento "$1" não é um diretório válido"
> exit 1
> fi
>
> find $1 -type f -iname "*.pdf" >> "$TEMP"
> while read LINHA; do
> echo "Titulo: `basename "$LINHA"`"
> ps2txt -vi $LINHA | grep -n "$2"
>
> done < $TEMP
> rm "$TEMP"
>
> Atenciosamente,
> Karin Klayton Schiochet
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>  
>


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]