[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs
From: |
Pierrick Brihaye |
Subject: |
Re: [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs |
Date: |
Mon, 18 Aug 2003 09:35:03 +0200 |
User-agent: |
Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02 |
Salut,
Martin Sevigny a écrit:
- indexation avec fragmentation
Lorsqu'on indexe des documents fragmentés, on n'a une mauvaise
information concernant le nombre de documents indexés (toujours 1), même
si tous les sous-documents sont listés. La sortie de l'indexation
pourrait être améliorée.
+1
- indexation avec documents attachés
Il pourrait être intéressant d'avoir des informations sur les documents
attachés lorsqu'on indexe, leur liste ou le nombre, selon les paramètres
spécifiés.
+1. Peut-on aller jusqu'au type MIME ? à la longueur de contenu ?
- messages d'indexation
Il pourrait être intéressant de supporter un élément <sdx:message> dans
le document d'indexation (sortie d'un pipeline d'indexation) qui
permettrait à SDX de logger ce message mais aussi de le retourner dans
les sdx:uploadDocument.
+1. C'est Pierre Dittgen qui avait lancé l'idée et j'avais proposé une
piste de résolution. Cependant, ça me pose un problème de design de code
: est-ce que la gestion de l'indexation doit se faire dans les classes
du package fr.gouv.culture.sdx.document ? Pour moi, on devrait essayer
de faire ça dans un truc comme :
fr.gouv.culture.sdx.search.indexing (et
fr.gouv.culture.sdx.search.lucene.indexing)
... et, au moins à terme, "Avaloniser" le package document pour lequel
le taux de recouvrement me semble a priori important.
- fieldlist réutilisables
Dans application.xconf, permettre de définir des <sdx:fieldList id=""/>
au niveau de l'application ou de la base de documents et y faire
référence dans une (autre) base de documents : <sdx:fieldList ref=""/>,
afin de permettre la constitution de multiples bases de documents
partageant la même structure.
+1. J'aimerais aussi la possibilité de *ne pas* définir de fieldlists
ou, en clair, d'avoir des FieldList dynamiques (réservées aux
utilisateurs avertis). Je ne sais pas ce que vous en pensez, mais un
moissonneur utilise a priori de telles FieldLists, non ?
- sdx:userIsAdminOrMember dans la taglib
+1. A ce propos, ne serait-il pas intéressant de développer des actions
Cocoon pour ceux qui veulent gérer ça en Sitemap ? La taglib pourrait
efficacement en faire usage.
- permettre de définir des groupes et des utilisateurs dans le .xconf
(généraliser sdx:admin?)
+1. Et avoir la possibilité de définir un chemin vers un fichier externe
d'utilisateurs ? Même chose d'ailleurs pour le fichier de config de base
: ça éviterait, au démarrage d'une appli SDX "packagée" d'avoir à
définir un SU.
- lastModificationDate() dans DocumentBase pour faciliter la gestion des
caches
+1
- trier les sdx:terms (sur le nombre de documents par exemple)
Vu la discussion à ce sujet... j'hésite encore sur la pertinence de ce
tri "partiel", mais bon... pourquoi pas ?
- exploiter [Lucene]Document.setBoost() et [Lucene]Field.setBoost() au
moment de l'indexation
+1.
- intégrer ceci http://sourceforge.net/projects/normalizer/ ?
Pas encore regardé en détail mais ça me fait penser à une autre question :
J'ai vu que SDX avait intégré les versions récentes de Lucene. Est-ce
que le highlighter fonctionne encore avec ce code ? Si oui, je vous
propose de vous envoyer un analyseur arabe assez performant (ça explique
mon silence du mois dernier ;-) : il ne reste "plus" qu'à le greffer sur
Lucene, ce qui, en matière de codage devrait se limiter à une
utilisation judicieuse de PositionIncrement lors de la fourniture des
tokens.
Autre chose sur le développement : je ne sais pas quel encodage utilise
votre éditeur Java : ça n'a pas l'air d'être de l'UTF si bien que les
accents des commentaires en français (venus de SDX 1) on du mal à passer.
A très bientôt,
--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
- [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Martin Sevigny, 2003/08/12
- Re: [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Malo Pichot, 2003/08/14
- Re: [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs,
Pierrick Brihaye <=
- RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Martin Sevigny, 2003/08/18
- Re: RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Pierrick Brihaye, 2003/08/18
- RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Martin Sevigny, 2003/08/18
- Re: RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Pierrick Brihaye, 2003/08/18
- RE : RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Rasik Pandey, 2003/08/25
- Re: RE : RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs, Pierrick Brihaye, 2003/08/26
- RE : RE : RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajoutsmineurs, Rasik Pandey, 2003/08/29
- Re: RE : RE : RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajoutsmineurs, Pierrick Brihaye, 2003/08/29