[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] Patch pour la gestion des nombres dans la recherche
From: |
Martin Sevigny |
Subject: |
Re: [sdx-developers] Patch pour la gestion des nombres dans la recherche |
Date: |
Mon, 12 Sep 2005 10:20:17 +0200 |
User-agent: |
Mozilla Thunderbird 1.0.6 (Windows/20050716) |
Bonjour,
L'indexation de SDX écarte, par défaut, les nombres et chiffres (si j'ai
bien compris). Du coup, il n'est pas possible de retrouver une date
citée dans un paragraphe de texte. Ce n'est pas très pratique (à mon
sens) et est des fois un peu déroutant pour un utilisateur "je ne
comprends pas, 1515 est dans le texte et l'application ne le trouve pas
:-(".
Effectivement. On peut avoir le problème pour autre chose que des dates
(des identifiants en général).
Voici donc un patch à appliquer sur le dossier (SDX2.2)
src\java\fr\gouv\culture\sdx\search\lucene\analysis et qui permet de
trouver les nombres dans la recherche.
J'applique ce patch (+ ou - manuellement) à chaque fois que je remets à
jour mon arborescence de source SDX à partir du CVS. S'il était intégré,
ce serait plus simple. Ce nouveau comportement ne casse rien et rend la
recherche plus pratique (selon moi).
Je reste à disposition pour plus d'infos sur les modifications réalisées :
- Modification de :
* fr.gouv.culture.sdx.search.lucene.analysis.Analyser_fr
* fr.gouv.culture.sdx.search.lucene.analysis.DefaultAnalyser
- Ajout de :
*
fr.gouv.culture.sdx.search.lucene.analysis.tokenizer.LaxistLowerCaseTokenizer
*
fr.gouv.culture.sdx.search.lucene.analysis.tokenizer.LetterOrDigitTokenizer
Je pense que ça peut être intégré, on va le faire dans les deux branches.
A bientôt,
Martin Sévigny