[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Pesquisar string em arquivo pdf
From: |
Karin Klayton Schiochet |
Subject: |
Pesquisar string em arquivo pdf |
Date: |
Mon, 28 Mar 2011 00:12:53 -0300 |
Pessoal,
Gostaria de saber se existe algum programa ou comando que possa ler um
arquivo pdf. A intenção é fazer um script que possa pesquisar no pdf por
alguma string passada via linha de comando.
Atualmente estou tentando usar o ps2txt para ler diretamente o
arquivo.pdf e fazer uma pesquisa nele, porem não está dando muito certo.
A intenção é inicialmente fazer algo do tipo ./script diretório
"STRING_PESQUISADA".
Se eu fizer diretamente no prompt de comando
$ps2txt Linux_Shell_Commands.pdf | grep -n "Linux Shell Commands"
9:UNIX/Linux Shell Commands
Ele me retorna o que pesquisei, mas em alguns arquivos que possuem
imagem ele me retorna alguns warning e erros e não realiza a pesquisa
correta no script.
Segue o que eu tenho tentado fazer.
#!/bin/bash
#
ARGS=2
TEMP=temp.$$
if [ "$#" -ne "$ARGS" ]
then
echo "Uso: `basename $0` diretório string"
exit 1
fi
if [ ! -d "$1" ]
then
echo "Argumento "$1" não é um diretório válido"
exit 1
fi
find $1 -type f -iname "*.pdf" >> "$TEMP"
while read LINHA; do
echo "Titulo: `basename "$LINHA"`"
ps2txt -vi $LINHA | grep -n "$2"
done < $TEMP
rm "$TEMP"
Atenciosamente,
Karin Klayton Schiochet
[As partes desta mensagem que não continham texto foram removidas]
- Pesquisar string em arquivo pdf,
Karin Klayton Schiochet <=