sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] Patch pour la gestion des nombres dans la recherche


From: Martin Sevigny
Subject: Re: [sdx-developers] Patch pour la gestion des nombres dans la recherche
Date: Mon, 12 Sep 2005 10:20:17 +0200
User-agent: Mozilla Thunderbird 1.0.6 (Windows/20050716)

Bonjour,

L'indexation de SDX écarte, par défaut, les nombres et chiffres (si j'ai bien compris). Du coup, il n'est pas possible de retrouver une date citée dans un paragraphe de texte. Ce n'est pas très pratique (à mon sens) et est des fois un peu déroutant pour un utilisateur "je ne comprends pas, 1515 est dans le texte et l'application ne le trouve pas :-(".

Effectivement. On peut avoir le problème pour autre chose que des dates
(des identifiants en général).

Voici donc un patch à appliquer sur le dossier (SDX2.2) src\java\fr\gouv\culture\sdx\search\lucene\analysis et qui permet de trouver les nombres dans la recherche. J'applique ce patch (+ ou - manuellement) à chaque fois que je remets à jour mon arborescence de source SDX à partir du CVS. S'il était intégré, ce serait plus simple. Ce nouveau comportement ne casse rien et rend la recherche plus pratique (selon moi).

Je reste à disposition pour plus d'infos sur les modifications réalisées :
- Modification de :
   * fr.gouv.culture.sdx.search.lucene.analysis.Analyser_fr
   * fr.gouv.culture.sdx.search.lucene.analysis.DefaultAnalyser
- Ajout de :
* fr.gouv.culture.sdx.search.lucene.analysis.tokenizer.LaxistLowerCaseTokenizer * fr.gouv.culture.sdx.search.lucene.analysis.tokenizer.LetterOrDigitTokenizer

Je pense que ça peut être intégré, on va le faire dans les deux branches.

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]