CRDO


Documents visibles : 151
Téléchargements : 360
Utilisateurs : 179 (30 pays)
Publications : 70
Langues parlées : 150

[Valid RSS]   [Valid Atom 1.0]

CRDO - Centre de Ressources pour la Description de l'Oral

http://crdo.fr

TGE-Adonis

CLARIN OAI
Archives ouvertes


-   [S'inscrire]   /   [S'identifier]   - 
--- --- --- --- --- --- --- --- --- --- --- --- 
/ 中文 /  English / español / français / 

Partage de données orales pour la recherche
(CRDO)

En raison d'un arrêt des systèmes informatiques pour des opérations de maintenance au CC-IN2P3, certains objets ne pourront pas être téléchargés les 21-22 septembre 2010.

Le CRDO est un service gratuit permettant aux laboratoires et aux chercheurs indépendants de partager librement leurs données orales tout en assurant leur archivage pérenne selon le modèle OAIS. Toutes les données sont référencées dans les répertoires internationaux comme OLAC (Open Language Archives Community) et Virtual Language World. De nombreux objets sont disponibles sur ce site :

  • les données primaires : corpus sonores/vidéos et tous signaux associés à la parole ;
  • les ressources : enrichissements de corpus, lexiques, bases de référence, systèmes de représentation, grammaires etc. ;
  • les outils dédiés à la linguistique ;
  • Les collections d'objets tels que définis ci-dessus.

En vous inscrivant sur le site du CRDO, vous bénéficierez de certains privilèges tels que :

  • le téléchargement des données présentes sur ce serveur (si votre groupe y est autorisé) ;
  • la possibilité de déposer vos propres données sur le site du CRDO ;
  • participer au développement de l'espace documentaire (CrdoWiki) des dépôts, équipes et projets en rapport avec les données partagées ou documentées sur ce site.

Les dépôts les plus récents >> pluspage 1  >>
[ARK] Outil Anonymisation de fichiers sonores (Daniel HIRST)
Laboratoire parole et langage (LPL, Aix-en-Provence FR) -> source
Script PRAAT.
Objet : remplacer les fragments d'un "long sound" étiquetés par un mot-clé par un son murmuré dont les caractéristiques prosodiques sont identiques à celles du son original.
Le fichier source peut être mono ou stéréo, sans incidence sur le résultat. [Détails]
(applied_linguistics, cognitive_science, language_documentation, speech_prosody, computational_linguistics)

>> Collection Outils LPL crdo000763
2010-07-28
Version 1
[ARK] Ressource Valjouffrey - travaux (Audrey THOMAS, Clément GIRARD, Médéric GASQUET-CYRUS)
Laboratoire parole et langage (LPL, Aix-en-Provence FR) -> source
1) Traductions, transcriptions et annotations des corpus de patois de Valjouffrey
2) Fichiers sonores, vidéos et annotations/sous-titrage accessibles publiquement pour le streaming [Détails]
(language_documentation, lexicography, sociolinguistics, anthropological_linguistics, text_and_corpus_linguistics, phonology, phonetics)
occitan (post 1500); occitan (post 1500) -> patois de Valjouffrey

>> Collection Valjouffrey crdo000007
picto
2010-07-23
Version 1
[ARK] Données primaires (corpus) PSH/DISPE - Parole subaquatique et/ou hyperbare (Alain MARCHAL)
Laboratoire parole et langage (LPL, Aix-en-Provence FR) -> source
Issu d'une collaboration entre le Laboratoire Parole et Langage (LPL) et l'Institut de Plongée Professionnelle de Marseille (INPP) en 1991, le corpus PSH/DISPE répond à la demande d'une base de sons pour le développement de nouveaux procédés de « décodage » de la parole hyperbare, et d'un outil pour l'évaluation des systèmes de communication vocale.
Les fichiers d'annotations sont conformes au format standard SAM Europec du projet CEE-ESPRIT n°2589. [Détails]
(phonetics, phonology)
anglais; français






2010-07-23
Version 1
[ARK] Données primaires (corpus) Mơ Piu (Geneviève CAELEN-HAUMONT)
Multimedia, Information, Communication and Applications (MICA, Hanoi VN)
Données collectées dans le cadre d'un premier terrain à Nậm Tu Thuʼợng chez les Mơ Piu entre le 8 et 12 juin 2009. Les corpus parole, chants, morceaux de musique, enregistrés sont répertoriés par jour, thème, locuteur, question (chant ou morceau instrumental de musique). A chaque couple question/réponse correspond un fichier wav. Les enregistrements ont été effectués en stéréo. Sur une piste le jour, le thème, le locuteur et le numéro de la question sont rappelés, suivis par une question en vietnamien (posée par un Vietnamien). Sur la seconde piste, en Mơ Piu, la même question est ensuite posée suivie de la réponse.
4 locuteurs, 3 locutrices, 7 chanteuses et 2 chanteurs ont été enregistrés. Soit au total, 7 heures de paroles et 1 heure de chants . [Détails]
(anthropological_linguistics)
vietnamien -> mơ piu

Rapport.pdf
2010-07-21
Version 1
[ARK] Données primaires (corpus) Derrida - Artaud (Bernard BEL)
Centre de sciences humaines (CSH, New Delhi IN)
Conference de Jacques Derrida sur Antonin Artaud. Séminaire In homage to Antonin Artaud organisé à New Delhi par National School of Drama, Delhi University et l'Ambassade de France, le 23 janvier 2997. [Détails]
(philosophy_of_language)
anglais (English)

2010-07-21
Version 1
[ARK] Données primaires (corpus) Derrida - State Of The Lie, Lie of the State
Derrida - Etat du mensonge, mensonge d'État
(Bernard BEL)
Centre de sciences humaines (CSH, New Delhi IN)
“State of the Lie, Lie of the State” (Etat du mensonge et mensonge d'Etat). Conférence de Jacques Derrida à Delhi School of Economics le 24 janvier 1997. [Détails]
(philosophy_of_language)
anglais (English)

2010-07-19
Version 1
Données primaires (corpus) गंगुबाई
Gangubai
(Bernard BEL, Hema RAIRKAR†)
Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)
Entretiens avec Gangu Ambore, une chanteuse lépreuse de Tadakalas, district de Parbhani au Maharashtra (Inde) le 5 février 1997. Gangubai exprime son affect par l'intermédiaire de chants de la mouture et de poèmes dévotionnels empruntés à une forme populaire de bhakti.
गंगुबाई अंबोरे या ताडकळस, जिल्हा परभणी, महाराष्ट्र, भारत, इथे रहाणार्या महारोगी बाईंची मुलाखत १९९६-९७ ला ध्वनीमुद्रित केली. त्या आपल्या मनातले अगदी जवळचे विचार जात्या वरील गणी व भक्तिपरंपरेतील अभंग, गौळणींच्या आधारावर अभिव्यक्त करतात. [Détails]
(linguistics_and_literature, pragmatics)
marathi (मराठी)

Le champ du dire et le soi de la parole (Guy Poitevin)
Bhakti, a Faith for Rehabilitation (G. Poitevin, H. Rairkar)

Voir preview




2010-07-16
Version 1
[testARK] Données primaires (corpus) C-PROM (Antoine AUCHLIN, U. Genève, Mathieu AVANZI, U. Neuchâtel/Paris X, Jean-Philippe GOLDMAN, U. Genève, Anne Catherine SIMON, UC Louvain)
Université de Genève, Département de linguistique (UNIGE, Genève CH)
Centre de recherche Valibel - Discours et variation (Valibel, Louvain BE)
Université de Neuchâtel (UniNE, Neuchâtel CH)
Modèles, dynamiques, corpus (MoDyCo, Paris FR)
C-PROM est un corpus aligné et annoté, développé pour l'étude des proéminences syllabiques en français. Il inclut 24 enregistrements échantillonnés en 7 genres (ou styles) de parole et produits par des locuteurs francophones (issus de Belgique, de France et de Suisse). Les données sonores (au format wav) sont accompagnées de fichiers d'annotation multi-niveaux (TextGrid) et de détection de F0 (Pitch). [Détails]
(speech_prosody, phonetics, text_and_corpus_linguistics)
français

Narration - récits de vie

Journal radiophonique

Interview radiophonique

Discours politique

Prescription d'itinéraires
2010-06-24
Version 1
[ARK] Ressource Étude sur le patois de Valbonnais (Marcelle PERY)
Dépôt personnel
Description lexicale et morphologique du patois de Valbonnais sous la forme d'un manuscrit de 319 pages.
Thèse sous la direction du Prof. Antonin DURAFFOUR (Univ. Stendhal, Grenoble, 1943) [Détails]
(language_documentation, lexicography, morphology)
occitan (post 1500) -> patois de Valbonnais; occitan (post 1500); franco-provençal
picto picto2
2010-06-08
Version 1
[ARK] Collection Collection de corpus trilingue français/anglais/espagnol
Laboratoire parole et langage (LPL, Aix-en-Provence FR) -> source
Corpus trilingue Français/anglais/espagnol
• Prononciation de voyelles isolées : toutes les voyelles du système de chaque langue
• 10 exemplaires de chaque voyelle
• Prononciation de mots monosyllabiques comprenant toutes les voyelles du système de chaque langue - 150 mots en espagnol
• 4 locuteurs (2 hommes, 2 femmes) dans chaque langue (sauf français et espagnol, manque un locuteur masculin – enregistrement prochain).
• Enregistrement chambre sourde [Détails]
(phonetics, phonology)
français; anglais; anglais -> anglais britannique; espagnol





2010-06-04
Version 1
>> plus

Les 8 objets les plus téléchargés
Données primaires (corpus) CID (Roxane BERTRAND)Téléchargé 39 fois (voir utilisateurs)
Ressource Enrichissements corpus CID (Roxane BERTRAND)Téléchargé 29 fois (voir utilisateurs)
Ressource VfrLPL (Stéphane RAUZY)Téléchargé 27 fois (voir utilisateurs)
Ressource Grammaire du français (GP) (Marie-Laure GUéNOT)Téléchargé 18 fois (voir utilisateurs)
Données primaires (corpus) Aix-MARSEC base de données (Daniel HIRST)Téléchargé 14 fois (voir utilisateurs)
Outil MOMEL (Daniel HIRST)Téléchargé 11 fois (voir utilisateurs)
Données primaires (corpus) EUROM1_fr (Daniel HIRST)Téléchargé 11 fois (voir utilisateurs)
Données primaires (corpus) Patois du Valjouffrey (Clément GIRARD)Téléchargé 9 fois (voir utilisateurs)

La navigation sur ce site est optimisée pour FireFox ou tout navigateur avec l'option « utiliser les onglets » activée.