sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-developers] Commits


From: Pierrick Brihaye
Subject: [sdx-developers] Commits
Date: Sat, 27 Sep 2003 21:26:28 +0200

Salut,

Je viens de commiter :

1) le jar d'un Stemmer arabe

2) les analyseurs SDX capable de s'en servir

3) un QueryParser capable de traiter les queries en arabe. Il y a également
un autre truc (v. plus bas, point 6)

4) un patch sur la classe Field : possiblité de fixer l'analyseur après
l'initialisation. Ce n'est pas très respectueux de l'AnalyzerMAnager, mais
bon..

5) des fichiers de données nécessaires à l'analyseur arabe. Ils sont
intégrés dans l'arborescence org.apache.lucene que j'ai ressucitée car je
compte filer l'analyseur arabe à Lucene. Or, il y a un pb de classloader qui
se trompe lorsqu'on cherche à accéder à des ressources contenues dans un jar
ayant la même arborescence : il semble que seul le jar Lucene soit pris en
compte (car utilisé le premier ?). Je n'ai trouvé que ça comme solution...
en attendant que l'analyseur arabe fasse partie du core Lucene ;-)

6) une classe UnanalyzedQuery (équivalent de l'ancienne TermQuery instanciée
dans la méthode getStringQuery() du QueryParser). Malheureusement, je n'ai
pas encore trouvé pourquoi Lucene renvoyait une mauvaise représentation de
ce type de Query :-( Quoi qu'il en soit, elle est bien parsée, ce qui est
toujours ça de gagné.

7) un build.xml à même de créer un patch Lucene contenant les ressources
citées en 5) et la classe citée en 6). Ce build vérifie également qu'on
travaille en JDK 1.4+ qui contient nativement une gestion des expressions
régulières nécessaires à l'analyseur arabe (et à d'autres futurs packages
?).

Voilà : ça a été pas mal testé, mais il serait pas mal de tester sur un JDK
1.3.

PS : j'ajoute à ma demande d'analyseur de recherche (vs. analyseur
d'indexation, le seul qu'on puisse configurer facilement) la possibilité
d'avoir un analyseur... de surlignage. Je n'aurais jamais cru un tel cas
possible mais je peux vous démontrer que le besoin existe :-)

A bientôt,

p.b.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]