sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] Travaux de developpement sur SDX


From: Pierrick Brihaye
Subject: Re: [sdx-users] Travaux de developpement sur SDX
Date: Tue, 18 May 2004 12:15:55 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.6) Gecko/20040113

Salut,

Emmanuel Bégué a écrit :

- au niveau "robustesse" et "indexation": nous utilisons SDX sur
une configuration où trois machines Tomcat vont lire un jeu de
fichiers uniques (index et bases hsql):

Si j'en crois tes messages récents, tu travailles avec du SDX 2.2. Or, il semblerait qu'une partie des problèmes que tu évoques sont réglés ou, en tout cas, mieux gérés dans la branche HEAD...

        . au niveau des fichiers d'index, lorsqu'on lance une
        indexation sur une machine (qui modifie donc le jeu unique
        de fichiers partagé par les trois machines), les fichiers
        d'index ne sont plus accessibles par les autres machines
        et on obtient l'erreur "stale nfs file handle";

Ici, je pense que les récents changements dans Lucene ont dû également améliorer les choses.

- au niveau de l'indexation proprement dite, dans le cas de l'indexation
d'un répertoire, il serait intéressant que SDX puisse de lui-même parcourir
une arborescence de répertoires (c'est à dire que selon un paramètre qui
pourrait être subdir="true", il indexe le contenu des répertoires sous
le répertoire fourni) plutôt qu'on doive lui soumettre chaque
répertoire l'un après l'autre (c'est peut-être déjà possible d'ailleurs?)

Pour autant que je m'en souvienne, la lecture des répertoires est récursive. Mais bon, tout à fait entre nous, je n'ai jamais bien compris le code de récursivité de la logicsheet :-)

- toujours à propos de l'indexation, il serait également très intéressant
qu'on puisse calculer dans la xsl d'indexation un paramètre qui serait
comparé à la valeur d'un champ pour ce document, si un document de même
identifiant est déjà présent dans l'index; le nouveau document ne serait
indexé que si cette valeur est différente/supérieure à la valeur indexée
(=> première utilité: n'indexer que les documents dont la date de mise
à jour est supérieure à la date d'indexation, cad qui ont été modifiés
depuis la précédente indexation -- comparaison avec sdxmoddate; mais on
peut en imaginer d'autres)

En gros, tu voudrais une indexation conditionnelle ? Si c'est le cas : +1.

>  -- c'est peut-être aussi déjà possible?

A priori non : si tu as décidé d'indexer, tu dois mener le processus à terme car la dynamique actuelle est d'effacer l'indexation avant de sauvegarder la nouvelle si bien qu'un retour en arrière est... difficile.

- au niveau Lucene, on lit dans la liste des changements récents que
depuis la version 1.4RC1 (point 5):
        Added support for hit sorting. Results may now be sorted by
        any indexed field. (Tim Jones via Cutting)
(cf.
http://cvs.apache.org/viewcvs.cgi/*checkout*/jakarta-lucene/CHANGES.txt?rev=
1.85)

"any" est peut-être beaucoup dire

Très juste. Cependant, utiliser cette fonctionnalité serait effectivement *très* intéressant.

[le snip du jour : 92 lignes tout de même. N'y a-t-il que moi qui soit gêné ?]

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78




reply via email to

[Prev in Thread] Current Thread [Next in Thread]