Gestion des droits d’accès en accord avec le Code du patrimoine : une approche générique pour le modèle OAIS implémenté au SLDR
La gestion automatisée des droits d’accès est pleinement opérationnelle au SLDR. Ce dispositif permet aux producteurs de données de spécifier les droits d’accès aux objets ou aux documents qu’ils contiennent dans les trois phases de leur cycle de vie : données source, diffusion et archive pérenne.
L’archivage exige la conformité avec les récentes dispositions du Code du patrimoine qui stipulent qu’une archive publique doit être immédiatement accessible. Des dérogations à ce principe sont toutefois prévues (et chiffrées en durée) pour protéger, entre autres, l’accès à des données relevant de la vie privée, du secret médical ou de dispositions contractuelles particulières.
Le SLDR fait apparaître explicitement les motivations des restrictions d’accès (comme la loi l’y oblige) ainsi que l'existence d'autorisations de diffusion. Les producteurs peuvent par ailleurs saisir l'ensemble des paramètres qui régissent l'évolution de ces droits d’accès sur le long terme, ainsi que des métadonnées confidentielles qui pourront basculer dans le domaine public au terme d'une période choisie par le déposant en conformité avec loi.
La mise en pratique de la gestion des droits d'accès est exposée aux producteurs de données sur la page Réglage des droits d'accès.
Le SLDR (Speech & Language Data Repository, anciennement CRDO-Aix,
http://sldr.org) est un service gratuit permettant aux laboratoires et aux chercheurs indépendants de partager leurs données orales/linguistiques tout en garantissant leur archivage pérenne. Bien qu’ils soient convaincus de l’intérêt de mutualiser et préserver les ressources collectées ou produites par leurs activités, les chercheurs hésitent souvent à passer à l’acte en raison d’une méconnaissance de leurs droits et devoirs : tout ce qui concerne la propriété commerciale et intellectuelle, la protection de la vie privée, l’identité des personnes, le consentement éclairé et autres dispositions légales.
Fin 2010, ces questions ont été inscrites à l’agenda du projet pilote TGE-Adonis/CINES/CC-IN2P3/CRDO pour la mutualisation et l’archivage des données orales, avec pour objectif l’élaboration d’un mécanisme de gestion des droits d’accès adapté au cadre législatif, récemment modifié, des archives publiques.
Cette page décrit les solutions implémentées au SLDR et soumises au groupe de travail du projet pilote. Elle ne prétend pas à l’exhaustivité et aucune information ne devrait être tenue pour définitive en raison de la nouveauté du mode opérationnel. (Le passage en production de l’archivage pérenne date de juillet 2010 pour ce qui concerne le CRDO-Aix/SLDR.) Une synthèse des discussions a été publiée ici : http://sldr.org/wiki/SyntheseDroitsAccesFevrier2001_fr.
Les données nominatives
Le SLDR est enregistré à la Commission nationale de l’informatique et des libertés (CNIL) sous la
déclaration No 1222972 en date du 26 mars 2008 qui l’autorise à stocker des données nominatives sous réserve que les personnes concernées aient accès à leur modification, leur rectification ou leur suppression (article 34 de la loi Informatique et libertés du 6 janvier 1978).
Les objets versés en archivage pérenne peuvent contenir des métadonnées confidentielles ainsi que des instructions pour l’évolution de ces informations sur le long terme. Par exemple, (1) les détails d’identité de l’ayant-droit sur le dépôt et (2) les noms complets de tous les informateurs ayant pris part à un entretien. Ces noms deviennent publiables à l’expiration de la période de restriction d’accès destinée à la protection de la vie privée (voir ci-dessous).
Par définition, les métadonnées confidentielles ne sont pas accessibles depuis le site de distribution alors qu’elles sont conservées par le site d’archivage. (Voir page 55 de la
présentation du SLDR.)
Toutes les archives doivent être publiques
L’archivage pérenne de données dans une archive institutionnelle doit se conformer aux dispositions légales en vigueur en France, à savoir le
Code du patrimoine, loi du 15 juillet 2008 consolidée le 13 janvier 2011.
Les articles importants :
- L211-1 : Les archives sont l’ensemble des documents, quels que soient leur date, leur lieu de conservation, leur forme et leur support, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l’exercice de leur activité.
- L211-2 : La conservation des archives est organisée dans l’intérêt public tant pour les besoins de la gestion et de la justification des droits des personnes physiques ou morales, publiques ou privées, que pour la documentation historique de la recherche.
L211-4 : Les archives publiques sont : (a) Les documents qui procèdent de l’activité de l’Etat, des collectivités territoriales, des établissements publics et des autres personnes morales de droit public ou des personnes de droit privé chargées de la gestion d’un service public, dans le cadre de leur mission de service public. (...)- L213-1 : Les archives publiques sont, sous réserve des dispositions de l’article L. 213-2, communicables de plein droit.
Les implications de ces articles sont doubles :
- Tous les documents produits ou collectés par les chercheurs dans le cadre de l'exercice d'une mission de service public sont des archives publiques. (À clarifier pour les chercheurs de droit privé…)
- Les archives publiques sont, par défaut, immédiatement communicables.
Cette dernière obligation est un changement radical de perspective puisqu’un délai de 30 ans était en vigueur avant le 15 juillet 2008.
Les contraintes du Code du patrimoine peuvent entrer en conflit avec les intérêts de chercheurs ou de collecteurs de documents à valeur patrimoniale. Toutefois nous allons voir qu’une interprétation flexible (bien que licite) de ces textes permet de gérer la plupart des problèmes rencontrés par la communauté scientifique.
Diffusion versus archivage pérenne
D’un point de vue archivistique, il est dit qu’un document ne devient une archive qu’à l’issue de sa "période d’utilisation courante". On peut donc considérer que l’archivage pérenne n’est obligatoire qu’une fois terminés les travaux sur le projet et les publications qui lui sont associées.
Les chercheurs qui souhaitent préserver et partager un document avant la fin de sa période d’utilisation courante peuvent les placer en mode diffusion qui ne donne pas au document le statut légal d'une archive (publique ou privée).
La durée de la période d’utilisation courante dépend bien entendu du projet. Elle peut inclure :
- la période d’embargo associée à la publication commerciale d’un document soumis au copyright ;
- en l'absence d'autorisation de diffusion (transfert des droits patrimoniaux de reproduction et de présentation), la période de réserve des droits patrimoniaux. (
Code de la propriété intellectuelle)
De manière générale, restreindre l’accès à un document n’est pas contraire à la loi tant qu’il ne s’agit pas d’une archive publique. Les producteurs de données peuvent donc imposer cette restriction sans rendre explicites sa motivation. Ils doivent cependant garder à l’esprit que ce statut coincide avec la période d’utilisation courante des documents.
Une spécificité du SLDR est l’utilisation du même modèle OAIS pour la diffusion et l’archivage pérenne. Du point de vue technique, en simple diffusion les données sont accessibles sur le site de diffusion (au CC-IN2P3) après un court passage sur le site d’archivage (CINES) au cours duquel les formats et l’arborescence des fichiers sont validés. Cette technique est fiable parce que le contenu intégral d’un objet peut être reconstruit à partir des datastreams qui servent à sa distribution sur le site de diffusion, et ce contenu fait l'objet d’une vérification de conformité avec l’objet à sa source (voir les pages 58-60 de la
présentation du SLDR). De plus, le SLDR est capable de gérer des URLs invariantes pointant vers des documents lorsqu’un objet bascule de la diffusion vers l’archivage pérenne, y compris lorsque de nouvelles versions sont archivées (voir page 28).
La diffusion avant archivage pérenne serait aussi envisageable sur un service d'archivage intermédiaire comme ceux proposés par le CINES dans le cadre du
projet ISAAC. Les statistiques (voir ISAAC) montrent qu’environ 20% des données ainsi partagées sont destinées à l’archivage pérenne. Sachant que seul le CINES est habilité à faire de l'archivage (intermédiaire ou pérenne), le mode diffusion n'est pas légalement équivalent à de l'archivage intermédiaire.
L’expérience montre qu’au terme d’un programme de recherche ses responsables manquent le plus souvent de temps, de ressources humaines (et certainement de motivation) pour déposer en archivage pérenne les données et résultats significatifs. Par exemple, le fait de devoir au dernier moment vérifier et transcoder des formats de fichiers pour garantir leur validation par la plateforme d’archivage (voir Formats) contribue fortement à cette démotivation. Il arrive même que des données primaires nécessaires à ce ré-encodage ne soient plus disponibles - par exemple, les vidéos non comprimées.
Pour ces raisons, nous estimons que le mode opérationnel du SLDR est bien adapté à une pratique vertueuse qui consiste à rendre possible la diffusion (avec accès sélectif) en début de projet. Nous recommandons d’ailleurs la création de fiches descriptives (métadonnées) avant même la collection de données car celles-ci produisent des identifiants que l’équipe peut citer à l’appui de sa recherche de collaborateurs et de financements.
Protection de la vie privée
Bien que classifié comme "archive publique", tout document peut bénéficier de restrictions d’accès si celles-ci sont motivées (et limitées) selon les dispositions de l’
Article L213-2.
- L213-2: Par dérogation aux dispositions de l’article L. 213-1 (...) les archives publiques sont communicables de plein droit à l’expiration d’un délai de ... (voir details).
Les types de dérogations au principe de libre communicabilité sont énumérés et codés dans un tableau. Cette présentation simplifie la déclaration du statut d’un document. La dérogation AR048 s’applique fréquemment aux données collectées au cours d’enquêtes : 50 ans. Documents dont la communication porte atteinte à la protection de la vie privée ou portant appréciation ou jugement de valeur sur une personne physique nommément désignée, ou facilement identifiable, ou qui font apparaître le comportement d’une personne dans des conditions susceptibles de lui porter préjudice. Pour le secret médical cette période peut être étendue à 120 ans (AR061).
Étant donnés le code de la dérogation et la date d’un enregistrement (ou celle du dépôt en archive, si la première est inconnue), le système implémenté au SLDR détermine automatiquement les droits d’accès à la date courante. Ces paramètres peuvent faire l’objet de déclarations différentes pour plusieurs documents appartenant au même objet. Par défaut, tout document hérite des droits d’accès du répertoire dans lequel il se situe.
Consentement éclairé, autorisations de diffusion
L’article L213-2 n’est qu’une dérogation à l’article L213-1 (voir ci-dessus). Il s’ensuit que les responsables de dépôts en archive pérenne devraient s’efforcer d’obtenir des autorisations pour que leurs documents soient accessibles avant l’expiration de la période de restriction associée à la dérogation. À cet effet, ils demandent aux informateurs/locuteurs/auteurs de signer des autorisations de diffusion.
Ces autorisations doivent être conformes au principe du consentement éclairé : elles doivent mentionner clairement que le signataire connaît le type et l’étendue de la diffusion prévue du document. Un exemple de formulaire repris par de nombreuses équipes est fourni dans l’ouvrage
Corpus oraux, guide des bonnes pratiques 2006. Une version adaptée au projet ICAR est ici :
http://icar.univ-lyon2.fr/projets/corinte/recueil/document_informations.htm. Un formulaire adapté au SLDR est ici :
http://sldr.org/doc/forms/ConsentementModele2_fr.doc.
Les signataires peuvent par ailleurs décider qu’un enregistrement audio/vidéo peut être partagé par la communauté de recherche mais pas rendu public. Dans ce cas, la
licence SLDR standard signée par les utilisateurs du SLDR devra être complétée par une licence particulière (voir exemple
http://sldr.org/sldr000761/licence/LicenceStRemy.pdf) ; cette licence particulière a été présentée aux informateurs/locuteurs/auteurs en annexe du formulaire de consentement.
Voir le formulaire adapté à cette situation :
http://sldr.org/doc/forms/ConsentementModele_fr.pdf
Pour tout ce qui concerne les données orales, et plus généralement les données primaires "sensibles", il est nécessaire de faire la distinction entre la diffusion du contenu (l’écoute d’un enregistrement, la visualisation d’une vidéo ou de photos) et la distribution de fichiers source en "haute résolution" qui peuvent donner lieu à des falsifications potentiellement dommageables aux locuteurs (imitation de voix etc.). Pour cette raison, le SLDR rend possibles la traçabilité et la transparence des opérations de téléchargement proprement dit (page 44 de la
présentation du SLDR) même lorsque les contenus sont diffusés en streaming.
Le SLDR permet aux déposants d’indiquer une date limite de l’autorisation de diffusion, au delà de laquelle le système basculera automatiquement les droits d’accès dans l’état prévu par la dérogation légale si l’autorisation n’a pas été prolongée. Nous pensons qu’inscrire une date limite n’est pas pertinent du point de vue juridique parce qu’un consentement éclairé peut être retiré à tout moment. Du point de vue technique, en cas de retrait du consentement, la date de retrait sera immédiatement saisie comme date limite de l’autorisation de sorte que le système puisse régler en conséquence les droits d’accès.
Les autorisations signées sont scannées et préservées en archivage pérenne aux côtés des métadonnées confidentielles (voir ci-dessus).
Copyright, propriété commerciale
Certains documents destinés à l’archivage pérenne peuvent faire l’objet de restrictions d’accès en raison d’un copyright. C’est le cas de publications dans des revues scientifiques. Bien qu’il soit souhaitable de préserver et de rendre disponible le contenu d’un article ou d’un ouvrage en complément des données primaires et secondaires auxquelles il fait référence, il se peut que son accès soit réservé pendant la période d’embargo imposée par l’éditeur commercial.
Si le document est de ceux auxquels on peut appliquer une dérogation au principe de libre communicabilité conforme à l’article L213-2 (voir supra) et si une autorisation de diffusion a par ailleurs été signée par les auteurs/informateurs/locuteurs, une solution raisonnable consiste à faire démarrer l’autorisation à la date de fin de la période d’embargo. Lorsque ces conditions ne sont pas remplies nous recommandons de ne pas déposer immédiatement le document en archive pérenne afin de limiter le risque juridique.
Il est envisagé d'utiliser le code AR039 (25 ans, "secret industriel ou commercial") pour des documents soumis à copyright, mais cette utilisation demanderait la confirmation de juristes.
Motivation du refus d’accès
Cette disposition découle de l’article suivant :
- L213-5 : Toute administration détentrice d’archives publiques ou privées est tenue de motiver tout refus qu’elle oppose à une demande de communication de documents d’archives.
La motivation de la dérogation au principe de libre communicabilité (voir art. L213-2) est affichée sur les fiches descriptives des objets dépossés en archivage pérenne et on la retrouve dans les métadonnées OLAC. Voir par exemple accessRights au sommet de
cette page.
Interventions
- Bel, Bernard.
Gestion des droits d’accès en accord avec le Code du patrimoine : une approche générique pour le modèle OAIS. Séminaire de l’AFCP Aspects éthiques et juridiques des corpus oraux, laboratoire Dynamique du langage (
DDL), le 10/5/2011 à Lyon. - Bel, Bernard.
Archivage intermédiaire et archivage pérenne des corpus oraux : modèle OAIS et gestion des droits d'accès. Ateliers de démonstration d'outils et de ressources, Colloque de l'Association for French Language Studies, Nancy, 9 septembre 2011. - Bel, Bernard ; Gasquet-Cyrus, Médéric. Le linguiste et ses corpus. Diffuser les données de la recherche en sciences humaines et sociales. Questions de droits et d'éthique 2. Journée d'étude à Aix-en-Provence (29/11/2011) dans le cadre d'un projet de publication collective coordonné par le Centre de ressources électroniques sur les villes (Crévilles) de la MSH de Tours, le Pôle image-son, pratiques du numérique de la MMSH d'Aix-en-Provence, la bibliothèque Éric-de-Dampierre du Laboratoire d'ethnologie et de sociologie comparative de la Maison René-Ginouvès (MAE) de Nanterre et avec le soutien de la MSH de Dijon. (
Voir annonce) - Bel, Bernard.
Mutualisation et archivage pérenne des données orales : un nouveau cadre technique et juridique au service de la recherche en linguistique. Colloque Les Archives de la Recherche : problèmes et enjeux de la construction du savoir scientifique. Université Paris-Sud 11 et CNAM, Paris, 18-20 janvier 2012. (
Voir programme)
