[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-users] z39.50
From: |
Frédéric Glorieux |
Subject: |
Re: [sdx-users] z39.50 |
Date: |
Tue, 05 Jul 2005 01:03:48 +0200 |
User-agent: |
Mozilla Thunderbird 1.0 (Windows/20041206) |
Bonjour,
Je suis actuellement stagiaire au CNRS et je travaille sur une
interface commune pour la recherche de documents bibliothécaires dans
différentes bases, et notamment avec le protocole z39.50. Mon maître
de stage s'est orienté vers SDX.
Bon choix, votre maître de stage est une personne éclairée :o)
Je découvre peu à peu son principe et
fonctionnement, en particulier l'indexation des fichiers XML dans les
entrepôts.
L'entrepôt est une notion fluide, par contre, pour XML, c'est
incontournable, à un moment ou un autre du process pour entrer dans SDX.
J'ai vu dans la documentation qu'il était écrit : "le
serveur pourra être responsable d'autres tâches, comme par exemple
servir d'interface pour des requêtes faites selon différents
protocoles, tels que Z39.50" mais je ne comprends pas bien le
principe. Est-il question d'une connexion à la base z39.50 et d'une
interrogation de celle-ci (et dans ce cas, à quel niveau se fait cette
connexion - classe Java ?...) ? Par ailleurs j'ai vu qu'il était
possible de créer de nouveaux entrepôts. Est-il possible de créer un
entrepôt z39.50 ? Et est-ce que cela a un intérêt ?
Je ne suis pas connaisseur z39.50, mais si j'avais ce genre de chose à
faire, je commencerai par savoir importer les enregistrements d'une base
vers des fichiers XML.
Autrement dit, il vous faut un "XMLiseur" de z39.50, qui n'est pas natif
dans SDX. Cette requête laisse croire que le problème n'est pas neuf
<http://www.google.com/search?q=Z39.50+xml>. Il faut se demander la tête
du XML que l'on veut gérer, pour les transformations (xsl) de
publication ou d'indexation. Vous penchez vers quelque chose comme
Dublin Core <http://dublincore.org/documents/dces/>, MODS
<http://www.loc.gov/standards/mods/>, marcxml
<http://www.loc.gov/standards/marcxml/>, biblioml
<http://www.biblioml.org/dtds/biblioml_030/html/index.html> ?
Au début, je commencerai par moissonner une centaine d'enregistrements
déposés statiquement en fichiers, me permettant de monter une
application dans le genre de sdxtest. Un seul entrepôt, et une seule
base cherchable (au sens SDX) suffisent (c'est testé jusqu'à 12 milions
de documents).
La base est une unité sémantique, elle définit un modèle de recherche
(division des champs). On ouvre une autre base quand une collection est
considérée comme n'étant plus homogène (exemple : une base pour les
notices d'oeuvres, une base pour les autorités auteurs)
Les entrepôts sont plus des unités physiques, elle permettent d'agréger
une base SQL, des fichiers, avec des URLs distantes (dès lors que l'on
sait faire répondre du XML).
Pour le moissonnage de vos serveur z39.50, il faudra je suppose une
logique spécifique pour aller les interroger régulièrement. Peut-être
pouvez vous trouver de l'inspiration dans les classes SDX dédiées à OAI
<http://www.openarchives.org/OAI/openarchivesprotocol.html> ? Si vos
serveurs z39.50 savait répondre comme des entrepôts OAI, il y aurait de
quoi faire que SDX sache les interroger, et les indexer.
--
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)
- [sdx-users] z39.50, Alexandre Huet, 2005/07/04
- Re: [sdx-users] z39.50,
Frédéric Glorieux <=