sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] RE : SDX 2.0?


From: Pierrick Brihaye
Subject: Re: [sdx-developers] RE : SDX 2.0?
Date: Fri, 08 Nov 2002 13:18:21 +0100
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0

Re,

Martin Sevigny a écrit:

Tu entends quoi par "traiter"?

Exploiter :-) Pouvoir, si l'envie m'en prend, faire une recherche sur les bouquins où un certain von Braun n'a pas écrit de bouquin avec un certain albert Einstein par exemple.

Le propre d'un SGBD XML, comme un SGBD SQL par ailleurs, c'est de ne pas
avoir d'index à créer pour faire de la recherche. Les index ne servent
qu'à optimiser les performances.

J'entends bien. Remplace "index" par "structure" et tu verras mieux mon besoin. Pour moi, l'objectif est bien de faire des recherches sur la structure *et* sur le contenu.

> Dans SDX, faute de solutions
satisfaisantes à l'époque (et encore aujourdhui à mon humble avis),
l'approche a été d'utiliser la structure au moment de l'indexation, d'où
la création des champs et la linéarisation des recherches.

Je ne la remets pas en cause : comme je le disais, ça concerne 97 à 98% de mes besoins actuels.

Maintenant, si on permet un moteur de type Xpath/Xquery dans SDX (et je
ne vois pas pourquoi on ne le ferait pas à moyen terme), "l'indexation"
va se limiter à inclure les documents dans le SGBD. On pourra avoir une
définition d'index de type SQL pour augmenter les performances, mais
c'est tout.

Ici, je ne suis pas d'accord, en tout cas si l'on reprend la terminologie actuelle de SDX. Pour reprendre ma problématique de "structure", tu me diras que je n'ai qu'à stocker dans SDX des documents nativement structurés comme je le désire. Or, ce n'est pas possible : mes documents *doivent* rester dans leur état initial car c'est bien cet état initial, très peu structuré, que je veux renvoyer aux utilisateurs.

Exemple, (qui intéressera peut-être Patrice qui veut faire "simple") :

J'ai un document avec une structure orientée "lecture", en DocBook par exemple :

<para>Cette maison a été construite en 1750 par Jean Dupont et a été détruite en 2002 par Jean-Louis Borloo</para>

C'est comme ça que mes collègues vont générer leurs documents.

Ensuite, je fais asser sur ce document une catégorie professionnelle apelée à un grand avenir : les "baliseurs".

<para>Cette <DENO>maison</DENO> a été <PHASE>construite</PHASE> en <DATE>1750</DATE> par <AUTR>Jean Dupont</AUTR> et a été <PHASE>détruite</PHASE> en <DATE>2002</DATE> par <AUTR>Jean-Louis Borloo</AUTR></para>

En fait, je leur aurais proposé un outil qui créera plutôt un truc avec cette allure :

<para>Cette <DENO ref="1">maison</DENO> a été <PHASE ref="3">construite</PHASE> en <DATE ref="4">1750</DATE> par <AUTR ref="5">Jean Dupont</AUTR> et a été <PHASE ref="7">détruite</PHASE> en <DATE ref="8">2002</DATE> par <AUTR ref="9">Jean-Louis Borloo</AUTR></para>
<indexation>
  <index>
    <index id="1" semantics="DENO">maison</index>
    <indexGroup id="2">
      <index id="3" semantics="PHASE">construite</index>
      <index id="4" semantics="DATE">1750</index>
      <index id="5" semantics="DATE">Jean Dupont</index>
    </indexGroup>
    <indexGroup id="6">
      <index id="7" semantics="PHASE">détruite</index>
      <index id="8" semantics="DATE">2002</index>
      <index id="9" semantics="DATE">Jean-Louis Borloo</index>
    </indexGroup>
  </index>
</indexation>

C'est précisément cette "indexation" (et surtout sa structure) que je veux garder. Mas bon, si tu me démontres que ce n'est pas nécessaire/pertinent, je m'inclinerai...

Ce qu'on perd avec cette approche (ou ce qui manque), c'est la
possibilité de présenter le contenu d'un index. C'est peut-être l'idée
que tu avais derrière la tête avec ton exemple, dans ce cas SDX pourrait
accepter des trucs du genre :

<sdx:document id="X">
  <sdx:index semantics="author">
    <author>
      <firstname>a</firstname>
      <lastname>b</lastname>
    </author>
  </sdx:index>
</sdx:document>

C'est ça.

Ainsi, lorsqu'on fait <sdx:index field="author">, on retournerait la
liste des entrées de cet index dans leur structure XML quelconque, celle
qui est fournie lors de l'indexation.

Oui. Avec la possibilité que je viens d'évoquer de "merges" avec d'autres indexations.

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden





reply via email to

[Prev in Thread] Current Thread [Next in Thread]