[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] RE : SDX 2.0?
From: |
Pierrick Brihaye |
Subject: |
Re: [sdx-developers] RE : SDX 2.0? |
Date: |
Fri, 08 Nov 2002 13:18:21 +0100 |
User-agent: |
Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0 |
Re,
Martin Sevigny a écrit:
Tu entends quoi par "traiter"?
Exploiter :-) Pouvoir, si l'envie m'en prend, faire une recherche sur
les bouquins où un certain von Braun n'a pas écrit de bouquin avec un
certain albert Einstein par exemple.
Le propre d'un SGBD XML, comme un SGBD SQL par ailleurs, c'est de ne pas
avoir d'index à créer pour faire de la recherche. Les index ne servent
qu'à optimiser les performances.
J'entends bien. Remplace "index" par "structure" et tu verras mieux mon
besoin. Pour moi, l'objectif est bien de faire des recherches sur la
structure *et* sur le contenu.
> Dans SDX, faute de solutions
satisfaisantes à l'époque (et encore aujourdhui à mon humble avis),
l'approche a été d'utiliser la structure au moment de l'indexation, d'où
la création des champs et la linéarisation des recherches.
Je ne la remets pas en cause : comme je le disais, ça concerne 97 à 98%
de mes besoins actuels.
Maintenant, si on permet un moteur de type Xpath/Xquery dans SDX (et je
ne vois pas pourquoi on ne le ferait pas à moyen terme), "l'indexation"
va se limiter à inclure les documents dans le SGBD. On pourra avoir une
définition d'index de type SQL pour augmenter les performances, mais
c'est tout.
Ici, je ne suis pas d'accord, en tout cas si l'on reprend la
terminologie actuelle de SDX. Pour reprendre ma problématique de
"structure", tu me diras que je n'ai qu'à stocker dans SDX des documents
nativement structurés comme je le désire. Or, ce n'est pas possible :
mes documents *doivent* rester dans leur état initial car c'est bien cet
état initial, très peu structuré, que je veux renvoyer aux utilisateurs.
Exemple, (qui intéressera peut-être Patrice qui veut faire "simple") :
J'ai un document avec une structure orientée "lecture", en DocBook par
exemple :
<para>Cette maison a été construite en 1750 par Jean Dupont et a été
détruite en 2002 par Jean-Louis Borloo</para>
C'est comme ça que mes collègues vont générer leurs documents.
Ensuite, je fais asser sur ce document une catégorie professionnelle
apelée à un grand avenir : les "baliseurs".
<para>Cette <DENO>maison</DENO> a été <PHASE>construite</PHASE> en
<DATE>1750</DATE> par <AUTR>Jean Dupont</AUTR> et a été
<PHASE>détruite</PHASE> en <DATE>2002</DATE> par <AUTR>Jean-Louis
Borloo</AUTR></para>
En fait, je leur aurais proposé un outil qui créera plutôt un truc avec
cette allure :
<para>Cette <DENO ref="1">maison</DENO> a été <PHASE
ref="3">construite</PHASE> en <DATE ref="4">1750</DATE> par <AUTR
ref="5">Jean Dupont</AUTR> et a été <PHASE ref="7">détruite</PHASE> en
<DATE ref="8">2002</DATE> par <AUTR ref="9">Jean-Louis Borloo</AUTR></para>
<indexation>
<index>
<index id="1" semantics="DENO">maison</index>
<indexGroup id="2">
<index id="3" semantics="PHASE">construite</index>
<index id="4" semantics="DATE">1750</index>
<index id="5" semantics="DATE">Jean Dupont</index>
</indexGroup>
<indexGroup id="6">
<index id="7" semantics="PHASE">détruite</index>
<index id="8" semantics="DATE">2002</index>
<index id="9" semantics="DATE">Jean-Louis Borloo</index>
</indexGroup>
</index>
</indexation>
C'est précisément cette "indexation" (et surtout sa structure) que je
veux garder. Mas bon, si tu me démontres que ce n'est pas
nécessaire/pertinent, je m'inclinerai...
Ce qu'on perd avec cette approche (ou ce qui manque), c'est la
possibilité de présenter le contenu d'un index. C'est peut-être l'idée
que tu avais derrière la tête avec ton exemple, dans ce cas SDX pourrait
accepter des trucs du genre :
<sdx:document id="X">
<sdx:index semantics="author">
<author>
<firstname>a</firstname>
<lastname>b</lastname>
</author>
</sdx:index>
</sdx:document>
C'est ça.
Ainsi, lorsqu'on fait <sdx:index field="author">, on retournerait la
liste des entrées de cet index dans leur structure XML quelconque, celle
qui est fournie lors de l'indexation.
Oui. Avec la possibilité que je viens d'évoquer de "merges" avec
d'autres indexations.
--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
- [sdx-developers] SDX 2.0?, Martin Sevigny, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Frédéric Glorieux, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/08
- [sdx-developers] RE : SDX 2.0?, Martin Sevigny, 2002/11/08
- Re: [sdx-developers] RE : SDX 2.0?,
Pierrick Brihaye <=
- RE : [sdx-developers] RE : SDX 2.0?, Martin Sevigny, 2002/11/08
- Re: RE : [sdx-developers] RE : SDX 2.0?, Pierrick Brihaye, 2002/11/08
Re: [sdx-developers] SDX 2.0?, Frédéric Glorieux, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/07
- Re: [sdx-developers] SDX 2.0?, Frédéric Glorieux, 2002/11/08
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/08
- Re: [sdx-developers] SDX 2.0?, Frédéric Glorieux, 2002/11/08
- Re: [sdx-developers] SDX 2.0?, Pierrick Brihaye, 2002/11/08
- Re: [sdx-developers] SDX 2.0?, Frédéric Glorieux, 2002/11/13
- [sdx-developers] RE : SDX 2.0?, Martin Sevigny, 2002/11/14