shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] procurar livro


From: caio ferreira
Subject: Re: [shell-script] procurar livro
Date: Sun, 19 Feb 2006 09:30:08 -0300
User-agent: Mozilla Thunderbird 1.0.7 (X11/20051017)

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

MrBiTs escreveu:
> caio ferreira wrote:
>  >       All
> 
>  >       Possuo uma série de livros e estou querendo catalogar os mesmo.
> 
>  >       Para fazer o cadastramento estou utilizando o software Tellico. para 
> fazer
>  > o cadastramento faço a pesquisa pelo número ISBN e adiciono o livro no
>  > sistema. O problema é que a maioria dos livros são em português e o
>  > software consulta a base de Amazon, com isso o software não esta
>  > encontrando a maioria dos livros. Mas se eu for no site da Livraria Cultura
>  > e procurar no sistema de busca[1] e procurar pelo ISBN eu encontro o livro.
>  > O problema é que procurar livro por livro vai demorar muito. Alguém por
>  > acaso saberia me dizer se é possível:
> 
>  > A-acessar o site de procurar da Livraria Cultura via links2/w3m/lynxs;
>  > B-passar o número ISBN para o browser;
>  > C-obter o resultado;
>  > D-filtrar o dado;
>  > E-gravar em um arquivo;
> 
> 1-http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=35CF5805&uid=
>  
> 
> Tá facil :)
> 
> wget
> "http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=3603BB3E&uid=&parceiro=IROJOJ&bmodo=&palavratitulo=&modobuscatitulo=pc&palavraautor=&modobuscaautor=pc&palavraeditora=&palavraISBN=12345&n1n2=&cidioma=&precomax=0&ordem=disponibilidade
>  
> 
> Veja que o método do form de procura é um método GET simples, ou seja,
> todas as variáveis de procura são passadas na própria URL. Basta
> substituir 12345 apos ISBN= pelo ISBN que você quer e pronto.
> 
> Depois disso, obviamente entra um trabalho seu de análise do código HTML
> para filtrá-lo. Para limpar as tags HTML do resultado, você pode fazer
> um sed 's/<[^>]*>//g' arquivo_resultado.html. Daí para frente, é só
> trabalho de filtar a informação.

        É isso mesmo.

        O problema esta sendo trabalhar com o resultado, não existe algo do tipo
"Título:O Guia do Mochileiro das Galaxia".  O nome do autor aparece algumas
linhas depois da palavra Título.

        Poderia enviar em anexo um arquivo que contem o resultado ?

        Desde já obrigado.

- --


 .''`.   Caio Abreu Ferreira
: :'  :  GNU/Linux Debian
`. `'`   fingerprint 0B5 0357 B80C E53C 5EF6  9D58 2D1B 0602 45E5 183A
  `-     Key ID 0x45E5183A
         Linux Couter 327834

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.2 (GNU/Linux)

iD8DBQFD+GTQLRsGAkXlGDoRAtBzAKCEMUM2lcCeQMuojUE7ef5inAWHSQCdGsBM
d/Sj9PzwVvrmlwxftIqZ240=
=HL+T
-----END PGP SIGNATURE-----


reply via email to

[Prev in Thread] Current Thread [Next in Thread]