sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [sdx-users] Apostrophes et sigles


From: Emmanuel Bégué
Subject: RE: [sdx-users] Apostrophes et sigles
Date: Mon, 3 May 2004 15:39:43 +0200

C'est à dire, "l'O.N.U." est d'un seul type à la fois du point de vue du
Tokenizer (et comme l'apostrophe est testée avant l'acronyme, il est
probablement plus du 1er type que du second) mais il est bien des deux
types à la fois "en vrai"?

Donc on pourrait, soit:
- faire repasser le résultat de l'analyseur une deuxième fois dans
l'analyseur, lorsque le premier passage a détecté une apostrophe,
pour voir si ledit résultat ne serait pas, désormais, un acronyme
- créer un nouveau type APOSTROPHE_ACRONYM qui teste les deux à
la fois.

Quelle est la meilleure solution?

À+
EB

> -----Message d'origine-----
> De : address@hidden
> [mailto:address@hidden
> De la part de Pierrick Brihaye
> Envoyé : lundi 3 mai 2004 14:30
> À : address@hidden
> Objet : Re: [sdx-users] Apostrophes et sigles
>
>
> Salut,
>
> Emmanuel Bégué a écrit:
>
> > donc une chaîne est apparemment d'un seul type, ce qui explique
> > que "l'O.N.U." ne soit pas traité correctement (il est des deux
> > types à la fois).
>
> Non. Il est d'un seul type à la fois mais... lequel ?
>
> Réponse dans :
>
> http://cvs.apache.org/viewcvs.cgi/jakarta-lucene/src/java/org/apac
he/lucene/analysis/standard/StandardTokenizer.jj?rev=1.6&view=markup
>
> Par ailleurs, pour bien comprendre ce qui est indexé (vs. ce qui est
> recherché), je ne peux que t'encourager à utiliser Luke pour voir ce
> qu'il y a dans tes index.
>
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
> [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip] [snip]
>
> A+
>
> --
> Pierrick Brihaye, informaticien
> Service régional de l'Inventaire
> DRAC Bretagne
> mailto:address@hidden
> +33 (0)2 99 29 67 78
>
>
>
> _______________________________________________
> sdx-users mailing list
> address@hidden
> http://mail.nongnu.org/mailman/listinfo/sdx-users
>





reply via email to

[Prev in Thread] Current Thread [Next in Thread]