sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] Entrepots OAI


From: Pierrick Brihaye
Subject: Re: [sdx-developers] Entrepots OAI
Date: Tue, 13 May 2003 15:11:36 +0200

Salut,

>Merci d'avoir jeté un coup d'oeil!

Pas de quoi. De plus, aujourd'hui, j'ai le temps :-)))

>>Il ne manque pas une espace dans oai_dc:dc/@xsi:schemaLocation ?
>>Pourquoi une différence entre header/identifier et
>>metadata/dc:identifier ?

>C'est corrigé.

OK. Mais on va reparler du dc:identifier... et des champs Dublin Core en
général.

>> Le paramètre "verb" a un comportement . C'est normal ?
>C'est corrigé. On envoie un message d'erreur.

OK.

>>Est-ce que la limitation du nombre de résultats est implémentée ? Si
>>oui, comment se configure-t-elle ? Histoire de tester les
>>resumptionToken...

>On n'a pas encore implémenté ni les "resumptionToken" ni "set".

Vu dans le code. Pour resumptionToken, ça devrait être assez facile... si le
repository n'a pas été modifié. Pour "set", on va en reparler...

>>i.e 2 fois le paramètre "identifier". Je sais bien que c'est une
>>habitude dans SDX :-), mais la spec OAI la refuse catégoriquement...

>C'est corrigé et maintenant ça envoie les metadonnées avec l'erreur:

<error code="badArgument">The request includes the duplicate argument,
identifier, only the first value provided,
sdx:localhost:8080:sdxtest/sdxworld/sangis, was used in processing this
request.</error>

OK : je mettrais des guillemets à "identifier" et à l'identifiant...
D'autres messages pourraient d'ailleurs faire l'objet du même traitement (y
compris certaines exceptions SDX d'ailleurs) et, pour certains, il manque
des quotes (p.e. http://localhost:8080/sdx/sdx/oai/sdxtest/sdxworld/xxx)

Sinon :

Identify ne renvoie pas baseUrl ? earliestDatestamp ? description ? Est-ce
que adminEmail est multi-instance (m'étonnerait : attribut dans le fichier
de config) ?

http://localhost:8080/sdx/sdx/oai/sdxtest/sdxworld?verb=ListIdentifiers&metadataPrefix=oai_dc
ne renvoie plus que 4 documents ?

http://localhost:8080/sdx/sdx/oai/sdxtest/sdxworld?verb=ListMetadataFormats&identifier=xxx
devrait me renvoyer une erreur d'après les specs.

>>Voilà : je crois que c'est tout sur les fonctionnalités. J'aurai
peut-être d'autres choses à dire, mais ça sera plutôt sur le design de
>>l'application.

>Je les attends...

OK. Reprenons le fichier de config :

<!-- oai repository configuration-->
   <sdx:oai-repository name="test oai repository for sdxworld document base
of the sdxtest application" adminEmail="address@hidden">

1er point : on parle de "oai-repository", mais, du point de vue SDX, c'est
un jeu d'index ou une "document base", non ? Comme sa structure est fixée
par le Dublin Core, je propose :
<sdx:documentBase ... implements="oai-repository"> ou quelque chose de
similaire... on en reparle de suite.

2ème point : adminEmail est normalement multivateur et donc difficile à
passer en attribut.

3ème point : ne serait-ce pas l'endroit pour mettre un attribut hpp qui
permettrait de limiter les récoltes... et de commencer les développements
sur les resumptionTokens ?

<sdx:oai-format name="OAI Dublin core" metadataPrefix="oai_dc"
namespace="http://purl.org/dc/elements/1.1/";
schemaUrl="http://www.openarchives.org/OAI/2.0/oai_dc.xsd";>

Ca, OK.

Là où j'ai plus de mal, c'est ici :

<sdx:oai-fields>
    <sdx:oai-field name="title" sdxField="titre"/>
    <sdx:oai-field name="source" sdxField="url"/>
    <sdx:oai-field name="identifier" sdxField="sdxdocid"/>
</sdx:oai-fields>

Pour moi, je ne vois pas le lien qu'il y aurait entre un jeu d'index "Dublin
Core" et un jeu d'index X ou Y (i.e. la base de documents "sdxworld"). Dans
cette perspective, pourquoi ne pas confier l'indexation à un pipeline comme
dans n'importe quelle base de documents SDX ?

De plus, la seule chose réellement imposée par OAI par rapport aux très
génériques bases de documents SDX, c'est la liste de champs ; c'est pour ça
que j'avais mis sdx:documentBase/@implements="oai-repository", mais,
honnêtement, je pense qu'il vaudrait mieux un élement (vide) du type :
<sdx:OAIfieldList> qui serait très élégant.

Ici, je ne vois pas trop la finalité :

<sdx:oai-format name="SDX"/>

Et ici, je devine ce que va va donner :

  <sdx:oai-subset>
   <sdx:include query="sdxdocid:b*"/>
   <sdx:exclude query="sdxdocid:a*"/>
  </sdx:oai-subset>

... même si toute explication est bienvenue.

Voilà. Je continue les tests...

PS : le build a été modifié et génère les javadocs. Bien ! Mais ne serait-il
pas souhaitable d'avoir des propriétés qui permettraient de s'en passer ;
même chose pour la doc d'ailleurs...

A très bientôt,

p.b.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]