sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Indexation conditionnelle


From: Emmanuel Bégué
Subject: [sdx-users] Indexation conditionnelle
Date: Tue, 18 May 2004 15:58:02 +0200

Bonjour,

> -----Message d'origine-----
> De la part de Rasik Pandey
> Envoyé : mardi 18 mai 2004 14:12
>
> IMHO, de comparer des champs Lucene d'un document sera du 
> gaspillage de ressources car on sera obligé de passer par une 
> transformation, une recherche pour retrouve le document, etc. 
> D'ailleurs de comparer de champs au niveau de Lucene ne sera pas 
> performante car on voit avec les derniers messages sur la liste 
> lucene-dev que tous les champs d'un document sont forcement 
> retournés quand on accède un document. Je crois que Myriam a 
> développe un "daemon" d'indexation de scanner un répertoire de 
> documents pour savoir quels documents étaient changés. Je vois 
> cette service comme une couche au-dessus d'une base de documents.

Ok, mais ça ne peut marcher que dans le cas où les documents
sont cachés, cad où il y a quelque chose (autre que l'index)
à quoi comparer le document à indexer?

Dans le cas où les documents sont produits à la volée, il faut
les indexer un par un (ou les copier dans un répertoire et
indexer le répertoire, mais ça devient assez compliqué si le
nombre de fichiers est très grand).

Effectivement, ça serait mieux de ne pas faire de recherche, mais
il est parfois impossible de faire autrement. On n'a pas mesuré
la différence de temps entre une recherche et une indexation, mais
je pense quand même qu'il est plus économique de mener n recherches
(sur un seul champ) et d'indexer, par exemple, (1% de n) documents,
que d'indexer les n documents un par un, systématiquement? Surtout
quand n devient grand?

Pour l'instant on a bricolé un script d'indexation, externe à SDX,
qui fait justement ça (rechercher, comparer, indexer), mais si
c'était possible dans la xsl d'indexation ça serait quand même
plus "beau" ;-)

Cdt,
EB





reply via email to

[Prev in Thread] Current Thread [Next in Thread]