sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : [sdx-developers] RE : Gestion de la mémoire


From: Pierrick Brihaye
Subject: Re: RE : [sdx-developers] RE : Gestion de la mémoire
Date: Tue, 21 Jan 2003 10:15:22 +0100
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0

Re,

Martin Sevigny a écrit:

Je comprends. Mais intuitivement, je pense que ce qui est le plus rapide
dans tout cela, c'est la méthode SearchEngine.search() (de Lucene à tout
le moins).

Beaucoup plus qu'un problème de performances, c'est selon moi un problème de Design. Etant donné que c'est l'appli qui demande des résultats, j'estime que c'est à elle de contrôler leur flux, de faire les allocations nécessaires et, éventuellement, de dire à Lucene : "ça va, n'en jetez plus !".

J'ai pas mal étudié le format de fichier utilisé pour la BD Lucene et je pense que je vais poser une question sur lucene-users pour en savoir un peu plus. En gros, ma question est là :

les termes sont placés dans un dictionnaire
les index stockent des références aux dits termes (index  inversé)

Dans ces conditions, à quoi servent les champ stockés ? On est a priori capable de reconstruire un terme à partir d'une référence, non ?

Certes, ça boufferait de la performance car on demande à la structure de fichiers de faire exactement l'inverse de ce pour quoi elle a été conçue.

Mais je me demande si :
1) il est effectivement possible de retrouver le terme à partir de sa référence. Ne serait-ce que pour faire un cas d'école. 2) au cas où cela serait possible, quel est le coût en terme de performances par rapport à l'option de champs stockés.

Si on a des benchmarks pour l'un et l'autre options, ça permettrait de faire une balance et par la même de mieux penser ses index, et donc son indexation.

Mon analyse est-elle bonne ?

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden





reply via email to

[Prev in Thread] Current Thread [Next in Thread]