shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Pesquisar string em arquivo pdf


From: Karin Klayton Schiochet
Subject: Pesquisar string em arquivo pdf
Date: Mon, 28 Mar 2011 00:12:53 -0300

Pessoal,

Gostaria de saber se existe algum programa ou comando que possa ler um
arquivo pdf. A intenção é fazer um script que possa pesquisar no pdf por
alguma string passada via linha de comando.

Atualmente estou tentando usar o ps2txt para ler diretamente o
arquivo.pdf e fazer uma pesquisa nele, porem não está dando muito certo.
A intenção é inicialmente fazer algo do tipo ./script diretório
"STRING_PESQUISADA".

Se eu fizer diretamente no prompt de comando 
$ps2txt Linux_Shell_Commands.pdf | grep -n "Linux Shell Commands"
9:UNIX/Linux Shell Commands

Ele me retorna o que pesquisei, mas  em alguns arquivos que possuem
imagem ele me retorna alguns warning e erros e não realiza a pesquisa
correta no script.

Segue o que eu tenho tentado fazer.
#!/bin/bash
#
ARGS=2
TEMP=temp.$$
if [ "$#" -ne "$ARGS" ]
then
    echo "Uso: `basename $0` diretório string"
    exit 1
fi

if [ ! -d "$1" ]
then
     echo "Argumento "$1" não é um diretório válido"
     exit 1
fi

find $1 -type f -iname "*.pdf" >> "$TEMP"
while read LINHA; do
     echo "Titulo: `basename "$LINHA"`"
     ps2txt -vi $LINHA | grep -n "$2"

done < $TEMP
rm "$TEMP"

Atenciosamente,
Karin Klayton Schiochet



[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]