sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] Commits du jour


From: Joran Le Cren
Subject: Re: [sdx-developers] Commits du jour
Date: Mon, 23 Aug 2004 19:42:29 +0200
User-agent: Mozilla Thunderbird 0.7 (Windows/20040616)

Pierrick Brihaye wrote:

Non seulement xa*?b*?c*? est acceptée par les ' 3 ' regexp mais aussi xa**?****dfdf**?**?**dqsd*??? ;o). C'est à Lucene de gérer ce cas de figure (à tester quand même ;-)).


C'était le sens de ma question. un ("*")* ne peut que poser ce genre de problème. Mais bon, ça doit pouvoir ce résoudre en sortant une belle exception... ou en dissociant le modèle de contenu pour "?" (troncature répétable) et "*" (troncature non-répétable).

J'ai testé la requête : An*?a*?e (pour annuaire), et ça semble fonctionner. Donc les multiples * ont l'air fonctionnels. J'ai également testé * et ? seuls et j'obtiens des résultats cohérents : * renvoie tous les documents (dans sdxtest tous les mots qui ont été indexé sont surlignés et les "de,le,pour" et autres mots vides ne sont pas surlignés); ? renvoie tous les documents qui contient un terme d'un caractère indexé (i.e les chiffres 1,2,...).

J'ai également testé une requête du type *-* et elle me renvoie les adresses e-mail du genre "address@hidden". Rmq : j'ai buté un moment sur le mot composé "plate-forme" qui ne m'était pas renvoyé quand je faisais "pl*-fo*". J'ai finalement découvert que le tiret de "plate-forme" n'était pas indexé.

Quant à *abc, elle est acceptée par la première et dernière regexp et elle fonctionne. Le test a été fait sur sdxtest avec une requête du type: *nuaire qui renvoie "Annuaire".


Euh... par quel prodige ? Je croyais que les troncatures initiales n'étaient pas gérées par Lucene. Ai-je loupé un épisode ?

A croire qu'elles le sont à présent. Et elles l'étaient avant que j'y touche... ;-).

A+

Joran.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]