sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] SDX 2.3 et entrepôt OAI


From: Pierrick . BRIHAYE
Subject: [sdx-users] SDX 2.3 et entrepôt OAI
Date: Tue, 19 Aug 2008 11:32:41 +0200

Bonjour,

Quelques questions suite à des expérimentations plus ou moins poussées visant à mettre en place un entrepôt OAI-PMH avec SDX 2.3.

1) Le module sdv_v2 (http://cvs.savannah.gnu.org/viewvc/sdx_v2/?root=sdx) est-il à considérer comme finalisé ?

2) Si oui, est-il possible de mettre à dispo une version finale de SDX 2.3 (prenant en compte la révision 1.69 qui semble être la dernière en date) ? Attention : build.xml est probablement à mettre à jour en fonction des JDKs actuellement disponibles.

Ayant travaillé avec une version 1.69 (étiquetée b1), voici les problèmes que je rencontre :

3) cosmétique :

WARN    (2008-08-19) 10:39.55:062   [sdx.framework] (Unknown-URI) Unknown-thread/LoggingUtils: SDX CONFIGURATION FAILURE: Unable to find an <sdx:pipeline> element at, file:/C:/Tomcat5.5/webapps/sdx/sdxtest/conf/application.xconf:349:57, the element should have an <sdx:index> subelement containing an <sdx:pipeline> element defining some transformations.
fr.gouv.culture.sdx.exception.SDXException: SDX CONFIGURATION FAILURE: Unable to find an <sdx:pipeline> element at, file:/C:/Tomcat5.5/webapps/sdx/sdxtest/conf/application.xconf:349:57, the element should have an <sdx:index> subelement containing an <sdx:pipeline> element defining some transformations.
at fr.gouv.culture.sdx.documentbase.AbstractDocumentBase.configurePipeline(AbstractDocumentBase.java:284)

4) Je cherche à mettre en place un <sdx:pipeline> dans mon <sdx:oai-format>. Ce pipeline reprend, en gros, mon indexeur qui est bien testé ;-) En tentant de cracher des élements <dc:foo>bar</dc:foo>, j'obtiens cette exception qui m'empêche d'aller plus loin :

ERROR   (2008-08-19) 10:46.47:781   [sdx.framework.MERIMEEIA29001872] (/sdx/sdx/oai/sribzh/db) http-8080-Processor25/LoggingUtils: SDX - Document - XML : erreur dans le document à missing exception detail : org.xml.sax.SAXException: Invalid processing instruction name (saxon:warning)
javax.xml.transform.TransformerException: org.xml.sax.SAXException: Invalid processing instruction name (saxon:warning)
at fr.gouv.culture.sdx.exception.SDXException.log(SDXException.java:125)
at fr.gouv.culture.sdx.exception.SDXException.<init>(SDXException.java:105)
at fr.gouv.culture.sdx.document.XMLDocument.parse(XMLDocument.java:197)
at fr.gouv.culture.sdx.repository.URLRepository.toSAX(URLRepository.java:403)
at fr.gouv.culture.sdx.documentbase.SDXDocumentBase.getDocument(SDXDocumentBase.java:501)
at fr.gouv.culture.sdx.documentbase.SDXDocumentBase.getDocument(SDXDocumentBase.java:544)
at fr.gouv.culture.sdx.oai.LuceneDocumentBaseOAIRepository.sendRecord(LuceneDocumentBaseOAIRepository.java:967)
...

L'exception étant avalée, il m'est impossible d'en savoir plus. J'ai bien pensé à un énième problème de DTD non trouvée mais, la suite le montrera, le processus peut continuer.

Bref, en sortie, je n'ai qu'un seul élement, le premier (pas encore vraiment finalisé ;-) :

<dc:coverage code="lat" xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">48.3881257</dc:coverage>

... mais pas les suivants que mon pipeline est censé générer.

5) d'où viennent ces attributs pourtant déjà présents dans l'élément racine :
<OAI-PMH xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">. Erreur dans le SAX ? A noter que le préfixe "dc" n'est pas défini.

6) en introduisant un élement conteneur (que j'ai nommé <a/> dans le namespace vide), j'obtiens cela :

<a xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:coverage code="lat">48.3881257</dc:coverage>
<dc:coverage code="lon">-4.4999217</dc:coverage>
<dc:field code="ref">IA29001872</dc:field>
<dc:date>2005</dc:date>
<dc:date>2005</dc:date>
<dc:author>xxxxxxxxx</dc:author>
<dc:publisher>(c) Inventaire général</dc:publisher>
<dc:publisher>2005</dc:publisher>
<dc:publisher>(c) Association Pour l'Inventaire de Bretagne</dc:publisher>
<dc:publisher>APIB</dc:publisher>
<dc:publisher>2005</dc:publisher>
</a>

... et pas d'exception dans mes logs :-)

7) même question pour les attributs et le préfixe.

8) cosmétique. J'obtiens :
header>
<identifier>sdx:localhost:8080:sribzh/db/MERIMEEIA29001872</identifier>
<datestamp>2008-08-18T14:26:41Z</datestamp>
</header>

J'imagine qu'on n'a pas de contrôle sur le format d'identifier ? Pas trop grave mais je me demande si l'hôte n'en dit pas trop...

9) Bref, puis-je espérer faire fonctionner un entrepôt OAI avec un pipeline avec SDX 2.3 ?

10) si non, comment migrer vers SDX 2.4 ?

Désolé pour ces nombreuses questions. Une réponse à la dixième me suffira pour l'instant :-)

A bientôt,

p.b.





reply via email to

[Prev in Thread] Current Thread [Next in Thread]