[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] Conservation des nombres dans la recherche plein-te
From: |
Pierrick Brihaye |
Subject: |
Re: [sdx-developers] Conservation des nombres dans la recherche plein-texte |
Date: |
Tue, 30 Mar 2004 12:37:34 +0200 |
User-agent: |
Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02 |
Re,
Pierre Dittgen a écrit:
Euh... plus compliqué : en "word", tout dépend de l'analyseur. Et le
choix de l'analyseur *peut* dépendre de la langue.
Tout à fait. Le raccourci était un peu rapide :-)
Oui :-)
En gros, il faudrait que je fasse un mixte entre LetterTokenizer
(accepte uniquement les lettres) qui est trop restrictif et
WhitespaceTokenizer qui est trop laxiste (accepte tous les caractères
qui ne sont pas des espaces).
Je pourrai écrire un LetterOrDigitTokenizer avec une méthode :
protected boolean isTokenChar(char c)
{
return Character.isLetterOrDigit(c);
}
C'est ça.
Ok, j'avais en fait fouillé dans le jar de Lucene avec Jad pour
décompiler les .class
Wow !
A+
--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78