sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] GPL vs ASF


From: Sylvain Wallez
Subject: Re: [sdx-developers] GPL vs ASF
Date: Sun, 03 Apr 2005 19:08:44 +0200
User-agent: Mozilla Thunderbird 1.0 (Macintosh/20041206)

Pierrick Brihaye wrote:

Salut,

Sylvain Wallez a écrit :

S'agit-il d'un plagiat ou d'une nouvelle implémentation ? Il n'y a pas 36 façons de coder cette fonction...


Y compris lorsque le nom de la classe, l'ordre de traitement des caractères Unicode, assez incohérent à vrai dire, sont les mêmes ?


Le nom de la classe ne me parait pas particulièrement discriminant. Quand à l'ordre des caractères, il suit globalement l'ordre croissant à l'exception des codes 0153, 152 et 178, que j'avais raté en première lecture. Dont acte, c'est bien un plagiat !

Au risque de me faire taper dessus, pourquoi ce code n'a-t-il pas été contribué à Lucene dès l'origine ?


A ma connaissance, seules 2 contributions des développeurs SDX ont pu entrer dans Lucene :

5. QueryParser now correctly works with Analyzers that can return more than one token per position. For example, a query "+fast +car"
    would be parsed as "+fast +(car automobile)" if the Analyzer
returns "car" and "automobile" at the same position whenever it finds "car" (Patch #23307).
    (Pierrick Brihaye, Daniel Naber)


et :

21. Added getFields(String) and getValues(String) methods.
     Contributed by Rasik Pandey on 2002-10-09
     (Rasik Pandey via otis)


Pas mal sont passées à la trappe pour des raisons parfois incompréhensibles (ou, plutôt, pour cause d'anglo-saxo-centrisme forcené :-).


Curieux. Y sont anti-français chez Lucene ? Parce qu'il y a des tokenizers allemands et russes depuis longtemps (2002 me dit le CVS) ?

Il faut bien le reconnaître cependant, un patch a désormais beaucoup plus de chances d'être intégré dans Lucene... tant qu'il ne touche pas aux analyseurs qui ont eu la chance d'être inclus dans le core.


D'après ce que je vois ils sont tous dans lucene-sandbox [1].

> Quel intérêt de le garder dans SDX ?

Faible, voire nul. C'est surtout le procédé qui me dérange :-)

Je contribuerai cependant bien volontiers à un Tokenizer "universel", fût-il en licence ASF :-)


Houla ! C'est techniquement faisable, ça ? Est-ce que ça ne dépend pas fortement de la langue ?

Sylvain

[1] http://cvs.apache.org/viewcvs.cgi/jakarta-lucene-sandbox/contributions/analyzers/src/java/org/apache/lucene/analysis/

--
Sylvain Wallez                        Anyware Technologies
http://apache.org/~sylvain            http://anyware-tech.com
Apache Software Foundation Member     Research & Technology Director





reply via email to

[Prev in Thread] Current Thread [Next in Thread]