|
From: | Pierrick Brihaye |
Subject: | Re: RE : RE : [sdx-developers] Intégration à SD X2.2 de la recherche des chiffres/nombres dans le texte ? |
Date: | Thu, 22 Apr 2004 17:39:45 +0200 |
User-agent: | Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02 |
Re, Rasik Pandey a écrit:
Moi, je suis près à m'investir sur le Tokenizer "universel" dont j'ai parlé". Je suis même près à la mettre en licence Apache :-):)
L'idée est de plus en plus claire pour moi. Un bon exemple des fonctionnalités à brancher est visible sur ce site :
http://www.fileformat.info/info/unicode/char/0645/index.htmLes "Unicode Data" et les "Java Properties" me sembleraient d'excellents critères à prendre en compte... ou pas.
Avec, derrière, une config XML, on peut assez vite se monter un jar comprenant pas mal de fichiers de configuration "standards"... ou pas (je vote d'ailleurs pour le PierreDittgenTokenizer.xml :-)
En parlant des contributions, propositions, etc... ça vaut le coup de suivre le "Thread" "incorrect OO in lucene source" de la liste lucene-dev au moins pour solliciter des avis pour ces interfaces.
Tu as raison. A+ -- Pierrick Brihaye, informaticien Service régional de l'Inventaire DRAC Bretagne mailto:address@hidden +33 (0)2 99 29 67 78
[Prev in Thread] | Current Thread | [Next in Thread] |