sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-developers] Re: [sdx-users] existe-t-il des applicationspubliq


From: Rasik Pandey
Subject: RE : [sdx-developers] Re: [sdx-users] existe-t-il des applicationspubliques SDX utilisantlethesaurus
Date: Thu, 17 Jun 2004 10:54:07 +0200

Bonjour,

> Je tiens à élargir cette question un peu:
> Le thésaurus qui est implémenté dans SDX charge tout le
> thésaurus en
> mémoire. Le thésaurus est présent comme fichier XML,
> ce qui est pratique pour des thésaurus de taille modeste.

On lit le fichier XML, et on le découpe pour avoir des sdx:concepts qui 
pourraient aussi avoir des enfants (sous-documents "sdx:concept") qu'on indexe 
dans une base de documents/thesaurus (LuceneThesaurus).

> Mais ...
> supposons par exemple que l'on désire indexer et limiter
> certains champs par
> un thésaurus comme le AAT, voire pire: un AAT qui est
> traduite en 6 langues. Ou un thésaurus de taille plutôt limité,
> mais avec
> des traductions en 10 langues, dont les équivalences peuvent
> être formulé comme 'inexacte, simple-multiple, partielle', etc.
> Donc:
> Supposons qu'on voudrait utiliser système alternatif de
> stockage et gestion
> de thésaurus.
> Serait il possible de renouer ce thésaurus de façon
> suffisamment profonde
> avec SDX?

Oui sans probleme du coté indexation, du coté recherche, il y a du travail à 
faire:

Une échange entre moi et Pierrick la semaine derniere:
-----------------------------------------------------
Pierrick:
> Par ailleurs, je me demande qans quelles mesure ont ne pourrait as
> ajouter ses propres relations, celles de Wordnet par exemple ;-
> )
> 
> Vos idées ?

Rasik:
Rien ne t'empêche à les créer mais il faut les ajouter également à ton 
sdx:fieldList dans ton application.xconf. Dans les méthodes spécifiques de 
SDXThesaurus.search (String term), il faudrait ajouter un moyen dynamique de 
interroger ces nouveaux champs( Vois LuceneThesaurus.search())...

--------------------------------------------------------

> Si on crée des classes qui se conforment à
>     public interface Thesaurus / public interface SDXThesaurus
> 
> sans que SDX devrait savoir comment ces classes implémentent
> ces méthodes
> (donc, d'où viennent les termes, les relations ...) ...

Un SDXThesaurus et qu'une base de documents (qui gerer les sous-documents). 
Est-ce une base de document n'est pas assez pour gerer ton cas? Le 
taglib/logicsheet traite un "SDXThesaurus" comme une base de documents.
 
> Quelles seraient les modifications à faire dans (un futur) SDX?
> Ca ne
> devrait pas avoir un formidable impacte, oui?

Il suffit de créer/surcharger SDXThesaurus pour le faire tourner avec SDX. On 
pourrait aussi rendre le code de SDX plus generique car il me semble que tes 
besoins sont assez generique.

> Et, si certaines braves utilisateurs et développeurs y
> apporteraitent
> volontiers leurs petits efforts?

Donnez-nous plus de détails...

A bientôt,
Rasik






reply via email to

[Prev in Thread] Current Thread [Next in Thread]