sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : [sdx-developers] Intégration à SDX2. 2 de la recherche des chif


From: Pierrick Brihaye
Subject: Re: RE : [sdx-developers] Intégration à SDX2. 2 de la recherche des chiffres/nombres dans le texte ?
Date: Fri, 23 Apr 2004 09:46:59 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02

Salut,

Pierre Dittgen a écrit:

Et ensuite un fichier de configuration qui, pour chaque langue de l'application, décrit les "pipelines" "tokenizer, filter1, filter2"...

Tout à fait Thierry :-)

Ca me botte bien ! On commence quand ? :-)

Ben... quand tu veux :-) Je peux bien sûr te donner un coup de main à partir de ce soir mais, si tu t'y mets de suite, tu devrais avoir fini :-)

IMHO, l'objectif est de tout donner à Lucene. Mais, comme ces messieurs répugnent à utiliser des packages externes, il faudra soigner le design.

En gros, on ne peut pas implementer l'interface Configurable sur les UniversalTokenizer/UniversalAnalyzer :-(

Il faudra, plutôt, implémenter cette interface sur une classe héritée, i.e. :

ConfigurableUniversalTokenizer/ConfigurableUniversalAnalyzer.

Tout le boulot de la communauté SDX serait ensuite de fournir des fichiers xml de config. Pour appater Lucene, on peut toujours leur donner les xml qui émuleraient leurs Tokenizers/Filters/Analyzers spécifiques.

IMHO, on n'a donc plus besoin que de 3 classes ou 6 si vraiment Lucene ne veut pas de notre truc. Tout le reste *doit* pouvoir s'écrire en XML.

PS : plutôt que Universal, revoyons les ambitions à la baisse en renommant Unicode. Java ne nous offre "que" ça.

Voilou. A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78





reply via email to

[Prev in Thread] Current Thread [Next in Thread]