See English version
Misma página en español
See 中文 version
http://sldr.org/wiki/Guidelines_fr
SLDR : bonnes pratiques pour la mutualisation et l'archivage pérenne de ressources orales
Table Of Contents 
- Questions préalables
- Que signifient « partage » et « archivage » dans la pratique ?
- Qui paie quoi ?
- Mes données
- Mes données sont-elles acceptables au SLDR ?
- Quid de la légalité ?
- Qui peut m'aider ?
- Dans la pratique
- Comment procéder ?
- La mise en forme de l'objet à archiver/distribuer
- Quelles seront les prochaines étapes ?
Cette page est la première mouture d'un guide de bonnes pratiques qui fait le meilleur usage des fonctionnalités courantes de SLDR dans son environnement OAIS (« Système d'information pour les archives ouvertes »). Cette version utilise une présentation par questions-réponses.
Pour les francophones, ces informations viennent en complément d'autres guides accessibles depuis cette page :
http://www.tge-adonis.fr/wiki/index.php?title=Guides
En tant que producteur d'une ressource orale (un objet) vous souhaitez peut-être savoir s'il peut être partagé et conservé au SLDR, et comment y parvenir. Lisez attentivement nos indications pour mettre en œuvre une solution évolutive (au niveau des droits d'accès) et parfaitement adaptée aux spécificités de votre ressource.
Les ressources orales numérisées (des objets de divers types) sont traitées comme des paquets d'information. Ce terme (information package) est emprunté au schéma OAIS et nous l'utilisons pour désigner un répertoire contenant des fichiers (presque) sans restriction sur leur nombre, leur volumétrie, leur hiérarchie et les codages des noms de fichiers.
Veuillez
nous contacter pour toute question ou correction !
Questions préalables
Que signifient « partage » et « archivage » dans la pratique ?
- SLDR offre la possibilité de partager des documents comme données courantes (sur le site versant), en préservation à moyen-terme (via la plateforme de développement du CC-IN2P3) ou en archivage pérenne (via la plateforme de production du CC-IN2P3 associée à la plateforme d'archivage du CINES). Les modalités d'accès aux documents sont identiques dans les trois cas, ce qui permet aux producteurs d'adapter la forme d'archivage de chaque objet au cycle de vie du projet de recherche dont il est issu.
Les ressources partagées par des producteurs individuels ou par des institutions grâce aux services de SLDR sont mises à disposition de tierces personnes (les utilisateurs) sur une base non-commerciale. Cette mise à disposition peut être régulée de plusieurs manières :
- Accès libre : un objet complet, ou certains fichiers dans un objet, peuvent être téléchargés par n'importe quel internaute et il ne sera conservé aucune trace de cette transaction. (Voir par exemple les liens au bas de la table des matières détaillée de l'objet
sldr000525.) - Accès contrôlé : les utilisateurs doivent être inscrits sur le site SLDR et appartenir à un groupe qui bénéficie de l'accès à l'objet. Une trace de cette transaction sera conservée sur le site ; de plus, il sera demandé à l'utilisateur d'approuver la licence SLDR ainsi que, le cas échéant, des conditions particulières imposées par le producteur de la ressource (exemple :
http://sldr.org/SLDRdata/licences/000761/LicenceStRemy.pdf). - Accès privilégié : le déposant d'un objet et certains utilisateurs privilégiés (définis par un couple identifiant/mot de passe) ont intégralement accès à toutes les versions de l'objet, ainsi qu'à la version en cours d'élaboration sur le serveur avant son dépôt en archive. Cette configuration est adaptée aux travaux en cours qui nécessitent le partage de données entre les membres d'un projet.
- Certaines métadonnées ne peuvent pas être diffusées publiquement avant une date fixée par le producteur de l'objet correspondant et/ou les dispositions légales concernant les données personnelles. Pour cela, les fiches du SLDR comportent des champs confidentiels.
- Le producteur d'un objet peut donner des autorisations d'accès à des personnes privilégiées avec plusieurs options non-exclusives : (1) téléchargement seul ; (2) accès aux fichiers source et versions précédentes ; (3) possibilité d'éditer les métadonnées descriptives.
- Accès libre : un objet complet, ou certains fichiers dans un objet, peuvent être téléchargés par n'importe quel internaute et il ne sera conservé aucune trace de cette transaction. (Voir par exemple les liens au bas de la table des matières détaillée de l'objet
- Les objets et fichiers en accès contrôlé ou privilégié ne peuvent être téléchargés qu'en passant par SLDR. La licence SLDR prohibe la redistribution individuelle (peer-to-peer) pour préserver l'intégrité des données. D'un point de vue technique, les fichiers peuvent être stockés sur le site SLDR (actuellement hébergé par l'Université de Provence) ou sur un site de distribution spécifique (le CC-IN2P3) conformément au modèle OAIS. Les utilisateurs n'ont pas besoin de connaître l'origine exacte de leurs téléchargements.
L'archivage est réalisé en quatre étapes :
- Les objets déposés sur SLDR sont protégés par des procédures de sauvegarde ;
- Au stade suivant, tout objet est aussi déposé sur la plateforme de test du service d'archivage (le CINES), ce qui permet de valider techniquement son contenu (principalement au niveau des formats et encodages de fichiers). Ces objets sont automatiquement transmis par le CINES au CC-IN2P3, le site de distribution ;
- Plusieurs versions d'un objet peuvent être déposées afin de prendre en compte ses modifications ; il n'y a pas de limite théorique au nombre de versions ;
- Une fois que l'objet est devenu stable (par exemple à la fin d'un projet) il est déposé sur la plateforme de production du service d'archivage et il reçoit un identifiant permanent d'archivage (ARK, Archival Resource Key). Il est de nouveau transmis par le CINES au CC-IN2P3 pour assurer sa distribution ; à ce stade il reste possible d'empiler des versions successives, mais un tel empilage n'est pas recommandé car le système maintient la possibilité d'accéder aux versions antérieures.
- Les services de SLDR font un usage intensif des identifiants et URLs pérennes. Ainsi, par exemple, en cliquant le lien
http://sldr.org/sldr000014/download on lance le téléchargement de l'objet
sldr000014, que l'objet correspondant soit distribué sur SLDR ou par le service de distribution (CC-IN2P3) en mode de test ou de production. (Pour plus de détails voir cette page.)
Qui paie quoi ?
- Les services du SLDR sont proposés gratuitement à la communauté de recherche internationale.
- Depuis sa création, SLDR est développé et entretenu par une équipe d'ingénieurs du Laboratoire Parole et Langage (LPL, Aix-en-Provence, France), une unité de recherche du Centre national de la recherche scientifique (CNRS) et de l'Université de Provence.
- Le modèle OAIS a été implémenté dans le cadre d'un projet pilote de TGE-Adonis pour le partage et l'archivage pérenne de ressources orales. Actuellement, l'archivage à long terme est assuré par le CINES dans le cadre juridique d'une délégation des Archives nationales (SIAF). Le site de distribution est un cluster TGE-Adonis hébergé par le CC-IN2P3.
Mes données
Mes données sont-elles acceptables au SLDR ?
- SLDR a mis en place un dispositif de partage et d'archivage générique qui couvre des ressources d'un champ disciplinaire très vaste incluant la linguistique expérimentale, la linguistique de terrain, la recherche sur la parole et le chant, la sociologie, l'anthropologie, la musicologie etc. Ce champ disciplinaire n'est pas limité aux sciences humaines et sociales puisqu'il inclut des travaux en sciences « dures » sur la production et la perception de la parole et du chant.
- Les données doivent présenter un intérêt scientifique ou/et patrimonial sur le long terme. Toutefois il faut garder en tête que de nombreuses productions culturelles sont déjà archivées sur des sites institutionnels (comme celui de l'INA) ; leur distribution via le SLDR nécessiterait donc une justification en termes d'intérêt scientifique.
- Les données doivent être numérisées. SLDR n'offre pas la possibilité de numériser des images, des textes ou des enregistrements analogiques.
- La page Formats donne la liste des formats acceptés par l'archivage. Tout fichier dans un autre format sera stocké et distribué mais pas archivé sur le long terme. Il est donc recommandé d'adopter ces formats aussi tôt que possible.
- Les producteurs doivent être en mesure de fournir des métadonnées descriptives les plus complètes que possible sur leur dépôt. Une partie de ces métadonnées peut être maintenue confidentielle (voir détails).
Quid de la légalité ?
- Les données sont partagées/archivées au SLDR sous la responsabilité de leur producteur qui peut être un chercheur indépendant ou affilié à un organisme de recherche.
- Les producteurs doivent être habilités à partager/archiver leurs dépôts selon les termes et conditions de la licence SLDR.
- Si l'objet est en accès libre, son utilisation sera de préférence réglementée par la licence non-commerciale
Creative Commons. La seule option permise actuellement est : Attribution-NonCommercial-ShareAlike 3.0 Unported. - Les producteurs ont l'entière responsabilité de l'attribution de droits d'accès aux objets et aux fichiers qu'ils contiennent. Cette attribution doit être compatible avec les droits internationaux régissant la propriété intellectuelle ainsi qu'avec les lois en vigueur dans le pays de résidence des locuteurs/interprètes.
- Les documents numériques archivés en France sont soumis au Code du patrimoine, loi du 15 juillet 2008, qui stipule (art. L213-1) que les archives publiques sont communicables de plein droit sous réserve des dispositions de l’article L213-2. Entre autres, la protection de la vie privée est un motif suffisant pour restreindre l'accès jusqu'à 50 ans après l'enregistrement, sauf si les informateurs signent des autorisations qui peuvent être limitées dans le temps ou/et retirées à tout moment. SLDR peut gérer toutes les situations prévues par la loi. Il faut noter toutefois que la loi ne concerne que l'archivage proprement dit ; les documents stockés pendant leur période normale d'utilisation peuvent être maintenus confidentiels pour d'autres raisons (par exemple un copyright).
- Chaque objet est régi par un ensemble de droits d'accès de manière indépendante des ressources qui lui sont associées. Cette disposition peut avoir une incidence sur votre décision de créer des objets distincts pour plusieurs ressources d'un projet : par exemple, l'accès aux données primaires (un enregistrement sonore) pourrait être plus restreint que celui à la transcription de cet enregistrement.
- Les droits d'accès aux objets ou aux fichiers individuels peuvent être modifiés à tout moment, y compris pour les objets déposés en archive pérenne. Toutefois il faut garder à l'esprit que dans ce dernier cas l'accès aux versions précédentes reste possible et qu'une procédure compliquée risque d'être nécessaire pour bloquer l'accès à des versions antérieures. Pour cette raison il est recommandé de ne procéder à l'archivage pérenne qu'une fois que les droits d'accès seront devenus stables pour l'ensemble de l'objet.
- La mise en pratique de la gestion des droits d'accès est exposée aux producteurs de données sur la page Réglage des droits d'accès.
Qui peut m'aider ?
- Contacter le
responsable des archives pour toute aide immédiate. Un suivi pourra ultérieurement être assuré par des chercheurs de votre discipline. - Le responsable des archives vous aidera à concevoir l'agencement de vos ressources en accord avec ces règles de bonne pratique et en tirant le meilleur profit de la flexibilité de la mise en forme des objets (voir détails).
Dans la pratique
Comment procéder ?
- Inscrivez-vous sur SLDR et attendez la validation de votre inscription par un administrateur. Votre statut professionnel doit être clairement énoncé et sera vérifié. Vos domaines de recherche sont aussi une information importante pour l'attribution d'un groupe.
- Créez une ou plusieurs fiches décrivant l'objet que vous souhaitez partager/archiver au SLDR. Attention de bien choisir la bonne catégorie d'objet — données primaires, ressource, outil ou collection — car cette catégorie ne pourra plus être modifiée.
- Entrez les métadonnées descriptives à partir de ce que vous comprenez du formulaire de saisie. Vous aurez tout le loisir de revenir à la fiche pour corriger et compléter les champs, le cas échéant avec l'aide du responsable des archives.
- La création de la fiche d'un objet produit immédiatement un identificateur pérenne OAI ainsi qu'une URL pérenne pour y accéder, par exemple oai:sldr.org:sldr000014 et
http://sldr.org/sldr000014. Elle produit d'autre part une page wiki qui lui est associée, par exemple
http://sldr.org/wiki/sldr000014, sur laquelle vous pourrez compléter à loisir la description de l'objet. Ces URLs restent inchangées quels que soient la version de l'objet et la configuration du site utilisé pour sa distribution. - Le responsable des archives sera informé de la création de votre fiche. Il/elle validera votre saisie et vous demandera le cas échéant de compléter la description. En même temps, vous pourrez discuter des droits d'accès et négocier le dépôt des données dans l'espace attribué à l'objet que vous avez décrit.
La mise en forme de l'objet à archiver/distribuer
- Si avez un peu d'expérience, lisez attentivement la page : Mise en forme des objets.
- Contactez le
responsable des archives pour tirer le meilleur parti des solutions proposées, même si vous n'avez aucune expérience du partage de données ou si les explications vous paraissent incompréhensibles. - SLDR est en phase de développement : nous avons besoin d'être confrontés à des situations inattendues pour améliorer le service !
Quelles seront les prochaines étapes ?
- Dans le cas d'un corpus audio/vidéo/texte vous devrez nous faire parvenir les scans des formulaires de consentement signés par les participants. Un formulaire simple est ici :
http://sldr.org/doc/forms/ConsentementModele2_fr.doc. Un formulaire plus complet est ici :
http://sldr.org/doc/forms/ConsentementModele_fr.doc qui nécessite l'ajout d'une licence complémentaire dont un exemple est ici :
http://sldr.org/sldr000761/licences//LicenceStRemy.pdf. - En tant que producteur d'un objet vous avez accès à sa communauté d'utilisateurs, autrement dit la liste des personnes qui l'ont téléchargé en accord avec la licence SLDR et, le cas échéant, les conditions particulières que vous avez énoncées. Voir par exemple
http://sldr.org/sldr000014/com. - Une fois que l'objet est en ligne vous pouvez lancer des requêtes pour le dépôt de plusieurs versions sur la plateforme de test du service d'archivage, et plus tard pour son dépôt sur la plateforme de production qui assurera son archivage pérenne.
- En tant que producteur d'un objet vous conservez à tout moment le droit de modifier ses métadonnées descriptives. Les modifications seront automatiquement transmises aux services d'archivage et de distribution. La modification des métadonnées et des documents annexes ne nécessite pas le dépôt d'une nouvelle version. (C'est un grand avantage du modèle SLDR.)
- Pour créer de nouvelles versions vous devrez contacter le responsable des archives et négocier le téléchargement des données mises à jour, suite à quoi l'objet sera ré-injecté dans le dispositif OAIS.
