sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-developers] Relations entre les documents


From: Martin Sevigny
Subject: [sdx-developers] Relations entre les documents
Date: Tue, 19 Nov 2002 16:49:32 +0100

Bonjour,

Depuis SDX 1, un document XML indexé peut avoir des documents attachés.
Il y a une relation entre ces deux documents, relation que SDX exploite
d'une seule façon : il détruit les documents attachés si le document XML
est détruit.

Par ailleurs, on doit développer une meilleure gestion des documents XML
volumineux, donc on a besoin d'un concept de fragment de documents.
L'idée est de donner la possibilité, au moment de l'indexation d'un
document XML, de spécifier des fragments de ce document, fragments qui
deviendraient des unités de recherche, tout comme les documents XML
actuels.

Lors de l'indexation, on pourrait permettre de générer une structure
comme celle-ci :

<sdx:document id="A">

  <sdx:field .../>
  <sdx:field .../>

  <sdx:document id="B">

    <sdx:field .../>
    <sdx:field .../>

    <sdx:document id="C"/>

  </sdx:document>

  <sdx:document id="D"/>


</sdx:document>

On peut voir ces fragments comme des relations : un document <fait
partie> d'un autre document, ou inversement un document <contient> un
autre document. Ainsi, dans l'exemple, je pense que l'on peut dire que A
contient B, C et D. On peut aussi dire que B contient C. Donc en plus
d'une relation "est attaché à", on aurait une relation "fait partie de".

Ayant deux relations possibles, on peut se poser la question : doit-on
rendre le concept générique? C'est-à-dire permettre tout type de
relation? On pourrait penser que je suis en faveur, puisque tout ou
presque est générique dans SDX, mais là je suis contre... Principalement
parce que ça cause un problème d'implantation.

Je suis aussi contre parce que je n'arrive pas à y trouver un intérêt
immédiat. Si le développeur veut ses propres relations, il n'a qu'à les
définir par des champs (on le fait souvent). SDX a besoin de ces deux
relations seulement dans le but de supprimer les documents en même
temps. Cette réflexion aurait même tendance à me faire dire qu'on a un
seul type de relation, documents attachés ou fragment de documents. Je
préfère toutefois les distinguer car les fragments sont indexés mais pas
les documents attachés. Peut-être auront nous besoins de cette
différence éventuellement.

Bref, pour ajouter cette fonctionnalité dans SDX 2, mais aussi pour
aller dans le sens des remarques de Pierrick, je crois qu'on doit faire
le choix maintenant de prévoir des relations (quitte à en ajouter
ultérieurement) ou de les laisser générique. Une fois cette décision
prise, on peut discuter de la meilleure implantation possible.

Qu'en pensez-vous?

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]