|
From: | Joran Le Cren |
Subject: | Re: [sdx-developers] Commits du jour |
Date: | Mon, 23 Aug 2004 19:42:29 +0200 |
User-agent: | Mozilla Thunderbird 0.7 (Windows/20040616) |
Pierrick Brihaye wrote:
J'ai testé la requête : An*?a*?e (pour annuaire), et ça semble fonctionner. Donc les multiples * ont l'air fonctionnels. J'ai également testé * et ? seuls et j'obtiens des résultats cohérents : * renvoie tous les documents (dans sdxtest tous les mots qui ont été indexé sont surlignés et les "de,le,pour" et autres mots vides ne sont pas surlignés); ? renvoie tous les documents qui contient un terme d'un caractère indexé (i.e les chiffres 1,2,...).Non seulement xa*?b*?c*? est acceptée par les ' 3 ' regexp mais aussi xa**?****dfdf**?**?**dqsd*??? ;o). C'est à Lucene de gérer ce cas de figure (à tester quand même ;-)).C'était le sens de ma question. un ("*")* ne peut que poser ce genre de problème. Mais bon, ça doit pouvoir ce résoudre en sortant une belle exception... ou en dissociant le modèle de contenu pour "?" (troncature répétable) et "*" (troncature non-répétable).
J'ai également testé une requête du type *-* et elle me renvoie les adresses e-mail du genre "address@hidden". Rmq : j'ai buté un moment sur le mot composé "plate-forme" qui ne m'était pas renvoyé quand je faisais "pl*-fo*". J'ai finalement découvert que le tiret de "plate-forme" n'était pas indexé.
A croire qu'elles le sont à présent. Et elles l'étaient avant que j'y touche... ;-).Quant à *abc, elle est acceptée par la première et dernière regexp et elle fonctionne. Le test a été fait sur sdxtest avec une requête du type: *nuaire qui renvoie "Annuaire".Euh... par quel prodige ? Je croyais que les troncatures initiales n'étaient pas gérées par Lucene. Ai-je loupé un épisode ?
A+ Joran.
[Prev in Thread] | Current Thread | [Next in Thread] |