Retour vers page d'accueil CRDO wiki
Centre de Ressources pour la Description de l’Oral
English version
Versión en español
中文 version
Ce serveur est géré par le groupe aixois « Ressources et outils d’analyse » du CRDO coordonné par le Laboratoire Parole et Langage (LPL).
Voir aussi le groupe parisien « Gestion documentaire et réservoir de données ».
Le
CRDO est un service gratuit permettant aux laboratoires de sciences du langage et aux chercheurs indépendants de partager librement leurs données orales tout en assurant leur
archivage pérenne selon le modèle OAIS. De nombreux objets sont disponibles sur le site :
- les
« données primaires » qui peuvent être des corpus sonores/vidéo bruts ou des séquences d’informations le cas échéant alignées sur ces documents : mesures de paramètres articulatoires etc. ; - les
« ressources » qui sont des ensembles d’informations structurées utilisées dans l’analyse ou la description de la parole : lexiques, tables de fréquences, bases de connaissances etc., ainsi que les enrichissements (annotations ou transcriptions) des corpus répertoriés parmi les « données » ; - les
« outils » qui sont des logiciels ou des matériels permettant l’analyse et l’enrichissement des données ; - les
« collections » qui sont des ensembles de données, ressources ou outils. (Une collection peut en contenir une autre.)
Spécificités de notre groupe
- Accès multilingue aux données : navigation quadrilingue (anglais/espagnol/français/chinois) et possibilité de saisir les descriptions, tables des matières et mots-clés dans une langue au choix en plus des langues de navigation.
- Le CRDO est entièrement au service de laboratoires producteurs (voir
liste actuelle) et de chercheurs indépendants au delà de toute frontière linguistique/géographique. Les travaux actuels visent à permettre aux laboratoires producteurs de mettre en place des services en ligne pour l'affichage/le streaming/l'analyse de leur propres données via la distribution du CRDO. - L'éventail des contributions est aussi large que possible, de la linguistique expérimentale (données de laboratoire) à la linguistique de contact (données de terrain).
- Les contributeurs s’efforcent de compléter la mise à disposition de données par les ressources et outils facilitant leur exploitation. Il s’agit de fournir un ensemble d’instruments allant du signal acoustique brut à l’édition et au traitement de ce signal. Un tel service doit donner accès aux informations elles-mêmes, à des outils et méthodes permettant d’en effectuer l’analyse, et autant que possible à des données enrichies par ces outils.
- À chaque objet peuvent être mis en
relation des publications, des LesEquipes et des programmes de recherche. - Par le biais de la signature d'une licence, la trace des téléchargements est préservée. D'autre part, les utilisateurs s'engagent (1) à mentionner clairement l'utilisation des objets distribués et (2) à inscrire sur le site les références des
publications où cette utilisation est mentionnée. Il est ainsi possible, pour tout corpus, outil ou ressource distribué par le CRDO, de démontrer concrètement son utilité à la communauté scientifique. - Tout producteur d'un objet distribué par le CRDO a accès aux informations de téléchargement et aux coordonnées, institutions et domaines de recherche des utilisateurs ayant téléchargé des objets via le CRDO. En complément du partage des
publications, cette fonctionnalité encourage l'émergence de communautés de producteurs et d'utilisateurs (approche Web 2.0) susceptibles de collaborer sur des programmes de recherche en sciences du langage faisant le meilleur usage des ressources disponibles.
- Récentes modifications sur le site du CRDO (à partir du flux RSS)
- Historique du projet
- Projet pilote CINES/CC-IN2P3/TGE-Adonis
- Développements récents
- Comité de pilotage
- AspectsJuridiques
- OLAC
- OAIS
- Collaborations de ce groupe
- Formats de données
- Groupes de travail
Page CRDO sur le wiki de TGE-Adonis- Liens et documentation
Le CRDO wiki
Cet espace wiki est dédié à la création et au partage d'informations sur :
- Les projets liés aux corpus, outils et ressources distribués ou documentés par le CRDO ;
- Les équipes travaillant sur ces projets ;
- Les chercheurs engagés dans ces équipes ;
- La documentation sur les corpus, outils et ressources distribués par le CRDO — des liens directs sont disponibles depuis les fiches de description sur
le site ; - Des ressources pour la création de corpus.
Nous vous recommandons toutefois d'utiliser en priorité Wikipedia
anglais ou
français pour tout contenu susceptible de présenter un intérêt encyclopédique en direction d'une communauté ouverte d'utilisateurs.
