sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] Entrepots OAI


From: Pierrick Brihaye
Subject: Re: [sdx-developers] Entrepots OAI
Date: Tue, 13 May 2003 16:01:57 +0200

Re,

On continue...

Pour factoriser la configuration, je verrai bien :

<sdx:OAIDocumentBase id="oai-repository" type="lucene" hpp="100">

En effet, il faut pouvoir intercepter le type le plut tôt possible (pour
instancier le LuceneOAIRepository)
L'attribut "hpp" serait une valeur par défaut (i.e. il faudrait une méthode
publique setHpp pour pourrait être utilisée depuis la logicsheet)

Ensuite :

<sdx:repositoryName>test oai repository for sdxworld document base of the
sdxtest application</sdx:repositoryName>

... qu'il serait peut-être pas mal d'ajouter à AbstractDocumentBase (et au
toSAX)... mais "repositoryName" est trop marqué OAI IMHO.

ensuite :

<sdx:adminEmail>address@hidden</sdx:adminEmail>
<sdx:adminEmail>address@hidden</sdx:adminEmail>

ensuite :
<sdx:oai-format name="OAI Dublin core" metadataPrefix="oai_dc"
> namespace="http://purl.org/dc/elements/1.1/";
> schemaUrl="http://www.openarchives.org/OAI/2.0/oai_dc.xsd";>

Donc... oas la peine d'avoir d'élément <sdx:oai-fields> IMHO :-)

Par contre, il maque peut-être qqes éléments de la norme :

<complexType name="IdentifyType">
  ..
  <element name="description" type="oai:descriptionType"
               minOccurs="0" maxOccurs="unbounded"/>

... qui pourrait entrer dans la config, IMHO.

  <element name="protocolVersion">

... qui pourrait être intéressant pour instancier les bonnes classes (i.e.
OAIRequest20 vs OAIRequest21)

Et, éventuellement :
  <element name="compression" type="string"
               minOccurs="0" maxOccurs="unbounded"/>

... qui est peut-être difficile à gérer (il faut aller dans les headers de
la request, faire du code d'arbitrage, et compresser la response avec les
headers ad hoc).

Voire :
  <element name="earliestDatestamp" type="oai:UTCdatetimeType"/>

Qui pourrait arbitrairement limiter les moissonneurs ("2019 don't forget to
come back then" ;-)

Il manque aussi, apparemment, ça :

<complexType name="recordType">
      ...
      <element name="about" type="oai:aboutType"
               minOccurs="0" maxOccurs="unbounded"/>

et là, je me demande si ça doit être vu comme un "champ" (i.e. particulier à
chaque enregistrement et donc en quelque sort à ajouter à la fieldList OAI)
ou si c'est générique au "repository", auquel cas ça aurait sa place dans le
fichier de config.

Sinon, <element name="deletedRecord" type="oai:deletedRecordType"/> a
normalement du sens dans Lucene ;-)) et peut en avoir dans certains types
d'architectures de jeux d'index.

A+

p.b.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]