|
From: | Pierre Dittgen |
Subject: | Re: RE : [sdx-developers] Intégration à SDX2. 2 de la recherche des chiffres/nombres dans le texte ? |
Date: | Fri, 23 Apr 2004 09:15:26 +0200 |
User-agent: | Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.5) Gecko/20031007 |
Ici encore, je pense qu'on devrait avoir un analyzeur "universel" auquel on brancherait les différents composants :UniversalAnalyzer.setTokenizer(MySpecificTokenizer); UniversalAnalyzer.addFilter(MYFilterNumber1); UniversalAnalyzer.addFilter(MYFilterNumber2); UniversalAnalyzer.addFilter(MYFilterNumber3);
Et ensuite un fichier de configuration qui, pour chaque langue de l'application, décrit les "pipelines" "tokenizer, filter1, filter2"...
Ca me botte bien ! On commence quand ? :-) Pierre -- Pierre Dittgen, address@hidden PASS Technologie http://www.pass-tech.fr
[Prev in Thread] | Current Thread | [Next in Thread] |