(Redirected from CRDO_FR)
Retour vers page d'accueil SLDR wiki
SLDR - Speech & Language Data Repository
Anciennement : CRDO-Aix, Centre de Ressources pour la Description de l’Oral
English version
Versión en español
中文 version
Voir la présentation sur une page :
http://sldr.org/doc/show/LeSLDR_fr.pdf et le diaporama détaillé :
http://sldr.org/doc/show/SldrPresentation-fr.pdf
Le
SLDR est un service gratuit de qualité certifiée (Trusted Data Repository) permettant aux laboratoires et aux chercheurs indépendants de partager librement leurs données orales tout en assurant leur
archivage pérenne selon le modèle OAIS. Ce site est celui du service versant anciennement désigné CRDO-Aix (identité :
http://sldr.org/oai-pmh.php?verb=Identify).
De nombreux objets sont disponibles sur le site :
- les
« données primaires » qui peuvent être des corpus sonores/vidéo bruts ou des séquences d’informations le cas échéant alignées sur ces documents : mesures de paramètres articulatoires etc. ; - les
« ressources » qui sont des ensembles d’informations structurées utilisées dans l’analyse ou la description de la parole : lexiques, tables de fréquences, bases de connaissances etc., ainsi que les enrichissements (annotations ou transcriptions) des corpus répertoriés parmi les « données » ; - les
« outils » qui sont des logiciels ou des matériels permettant l’analyse et l’enrichissement des données ; - les
« collections » qui sont des ensembles de données, ressources ou outils. (Une collection peut en contenir une autre.)
Le site
sldr.org est hébergé par l'Université Aix-Marseille. Les données sont archivées au CINES, une archive institutionnelle bénéficiaire du Data Seal of Approval, et distribuées sur la grille TGE-Adonis hébergée par le CC-IN2P3.
- Historique du projet
- Diaporama de présentation détaillée :
http://sldr.org/doc/show/SldrPresentation-fr.pdf - Présentation PowerPoint pour le Comité de visite de l'AERES, 15 décembre 2010 :
http://sldr.org/doc/aeres/diaporama.ppsx - Bilan du projet pilote TGE-Adonis/CRDO/CINES/CC-IN2P3 (janvier 2011)
CRDO report to CLARIN (26 janvier 2011)
CRDO-Aix renamed SLDR (CLARIN News)- Questions en attente : projets et discussions avec nos partenaires
- Projet d'ouvrage : Using the OAIS model for the medium and long-term preservation of oral/linguistic resources
La mutualisation des ressources en sciences du langage répond au besoin stratégique de rapprocher les connaissances aujourd’hui dispersées dans des domaines variés comme la linguistique descriptive, formelle et computationnelle, la littérature, la traductologie, les neurosciences et la psycholinguistique.
- Pour plus de détails, consulter le guide des bonnes pratiques pour la mutualisation et l'archivage pérenne de ressources orales au SLDR.
- Informations de pérénisation du SLDR :
http://sldr.org/ppdi
Spécificités de SLDR
- Le SLDR offre la possibilité de partager des documents comme données courantes (sur le site versant), en diffusion (via la grille TGE-Adonis hébergée sur la plateforme de développement du CC-IN2P3) ou en archivage pérenne (via la grille TGE-Adonis associée à la plateforme d'archivage du CINES). Les modalités d'accès aux documents sont identiques dans les trois cas, ce qui permet aux producteurs d'adapter les modalités de diffusion et d'archivage de chaque objet au cycle de vie du projet de recherche dont il est issu.
Toutes les situations ont été implémentées concernant l'accès aux données :
- Objets en libre accès (accessoirement sous licence Creative Commons) ;
- Objets en accès réservé (en fonction de groupes d'utilisateurs) ;
- Objets en accès réservé avec certains fichiers en libre accès ;
- Objets en accès privilégié pour certains utilisateurs (téléchargement, fichiers source, versions, édition des métadonnées).
- Chaque document (datastream) d'un objet donné peut avoir un statut privé ou public. Le statut public permet son téléchargement direct (sans authentification de l'utilisateur).
- Le statut privé/public de tout document dans toute version d'un objet peut être modifié sans dépôt d'une nouvelle version.
- Des documents descriptifs annexes (autorisations, licences, notes…) peuvent être ajoutés/supprimés/modifiés sans déposer une nouvelle version de l'objet.
- Accès multilingue aux données : navigation quadrilingue (anglais/espagnol/français/chinois) et possibilité de saisir les descriptions, tables des matières et mots-clés dans une langue au choix en plus des langues de navigation.
- Le SLDR est au service des laboratoires producteurs (voir
liste actuelle) et des chercheurs indépendants au delà de toute frontière institutionnelle/géographique. L'architecture client-serveur permet aux laboratoires producteurs de gérer des services en ligne pour l'affichage/le streaming/l'analyse de leurs propres données via la distribution du SLDR. - L'éventail des contributions est aussi large que possible, de la linguistique expérimentale (données de laboratoire) à la linguistique de contact (données de terrain).
- Les contributeurs s’efforcent de compléter la mise à disposition de données par les ressources et outils facilitant leur exploitation. Il s’agit de fournir un ensemble d’instruments allant du signal acoustique brut à l’édition et au traitement de ce signal. Un tel service doit donner accès aux informations elles-mêmes, à des outils et méthodes permettant d’en effectuer l’analyse, et autant que possible à des données enrichies par ces outils.
- À chaque objet peuvent être mis en
relation des publications, des équipes, laboratoires et programmes de recherche. - Chaque objet peut être déposé à titre personnel ou sous l'égide du/des laboratoire(s) producteur(s) auquel(s) le/les auteur(s) étai(en)t affecté(s) au moment de sa création. Tout laboratoire producteur peut installer sur son système d'information un gestionnaire d'instructions qui renvoie aux objets déposés en son nom au SLDR. (Voir détails et la
liste des laboratoires producteurs). - Par le biais de la signature d'une licence non-commerciale, la trace des téléchargements est préservée. D'autre part, les utilisateurs s'engagent (1) à mentionner clairement l'utilisation des objets distribués et (2) à inscrire sur le site les références des
publications où cette utilisation est mentionnée. Il est ainsi possible, pour tout corpus, outil ou ressource distribué par SLDR, de démontrer concrètement son utilité à la communauté scientifique. - Tout utilisateur d'un objet distribué par SLDR a accès aux noms, institutions et domaines de recherche des utilisateurs ayant téléchargé le même objet. En complément du partage des
publications, cette fonctionnalité encourage l'émergence de communautés de producteurs et d'utilisateurs (approche Web 2.0) susceptibles de collaborer sur des programmes de recherche faisant le meilleur usage des ressources disponibles. - Récentes modifications sur le site de SLDR (à partir du flux RSS)
- Journal de l'élaboration du site
- Projet pilote CINES/CC-IN2P3/TGE-Adonis
Project Preservation Description Information (PPDI)- AspectsJuridiques
- OLAC
- OAIS
- Formats de données
- Groupes de travail
- Liens et documentation
Included from reference-documents
Documents de référence / Reference documents
- Projet pilote TGE-Adonis/CINES/CC-IN2P3/CRDO d'archivage pérenne et de mutualisation des données orales
Pilot project for the storage, long-term preservation and sharing of oral resources TGE-Adonis/CINES/CC-IN2P3/CRDO) - Archive du projet pilote :
ark:/87895/1.4-187408 - Consortium Corpus oraux et multimodaux (IRCOM) de la TGIR-CORPUS
Consortium on oral and multimodal corpora (IRCOM) of TGIR-CORPUS
Lettre de mission du CRDO (15 février 2006)- Rapports d'activités :
CRDO Aix/Paris (juin 2006) et
CRDO-Paris (décembre 2006)
Hosting of IT services and data for Human and Social Sciences in France (Olof BÄRRING, 31/1/2008)
Mutualisation de la pérennisation et de l'accès aux données - Projet pilote sur les données orales version 0.7 (TGE-Adonis, 30/6/2008)
Mutualisation de la pérennisation et de l'accès aux données en SHS : bilan du projet pilote sur les données orales (Claude HUC, 12 mars 2009)
Rapport d'avancement du projet pilote sur les données orales (Claude HUC, 2 avril 2009)
TGE Adonis – Projet d’archivage des données produites en France par les SHS / Projet pilote sur les donneées orales, novembre 2008 – avril 2009
Rapport d’expertise sur la version préliminaire du résumé opérationnel (Yves MARCOUX, 28 mai 2009)
Évaluation du projet pilote 22 juin 2009 (TGE-Adonis)
Présentation à la Direction des Archives de France du projet pilote d'archivage pérenne des données orales, 23 octobre 2009- Lettre d'intention Lacito/LPL (18 mai 2010) :
texte et
annexe Convention régissant un service de préservation à long terme de documents numériques - entre le CINES et le CNRS au nom et pour le compte du TGE-Adonis, 25 mai 2010
Annexe 0 : Liste des services versants habilités par le service commanditaire à verser des documents électroniques au service d'archives
- Mise au point avant le passage en production de l'archivage pérenne, 18 juin 2010
- Bilan du projet pilote (janvier 2011)
Vers un CRDO « élargi » : rapport (mensonger) de Mathilde Schmitt, mai 2011
Lettre à la direction de TGE-Adonis (Direction du LPL, 15 juin 2011) => remerciements + communication sur CRDO-Aix
Lettre à la direction de TGE-Adonis (Direction du LPL, 29 juin 2011) => cadre juridique (rappel le 2 mars 2012, documents reçus le 19 mars)- Les services versants CRDO-Aix et CRDO-Paris : caractéristiques techniques
CRDO-Aix renamed SLDR (CLARIN News)
SLDR presentation in CLARIN-D tutorial (7 September 2011)
Présentation de CLARIN à la réunion du Consortium Corpus oraux et multimodaux (IRCOM) de la TGIR-CORPUS, 5 octobre 2011
SldrWiki
Cet espace wiki est dédié à la création et au partage d'informations sur :
- Les projets liés aux corpus, outils et ressources distribués ou documentés par le SLDR ;
- Les équipes travaillant sur ces projets ;
- Les chercheurs engagés dans ces équipes ;
- La documentation sur les corpus, outils et ressources distribués par le SLDR — des liens directs sont disponibles depuis les fiches de description sur
le site ; - Des ressources pour la création de corpus.
