Fil RSS du site CRDO
Ordre chronologique décroissant des modifications de métadonnées
Speech and Language Data Repository
Banque de données parole et langage (SLDR)
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus français manuellement phonétisé et aligné d'une durée de 7 minutes. Composé de 3 sous-corpus : CID, AixOx et Grenelle.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody, text_and_corpus_linguistics
Corpus français manuellement phonétisé et aligné d'une durée de 7 minutes. Composé de 3 sous-corpus : CID, AixOx et Grenelle.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody, text_and_corpus_linguistics
[coréen] Record person names with four channels at the same time.
[suédois] Göteborgs universitet (GU, Göteborg SE)
Department of Language Studies, Umeå university (Umeå SE)
Department of linguistics, Stockholm University (SU, Stockholm SE)
Linguistics and Phonetics, Lund University (LU, Lund SE)
This research database consists of recordings of a little more than 1300 speakers representing 107 Swedish dialects. Each recording consists of two major parts. One part consisting of controlled material where specific aspects of Swedish phonology are elicited and one part containing spontaneous speech in the form of informal interviews or dialogues between two speakers of the dialect.
Department of Language Studies, Umeå university (Umeå SE)
Department of linguistics, Stockholm University (SU, Stockholm SE)
Linguistics and Phonetics, Lund University (LU, Lund SE)
This research database consists of recordings of a little more than 1300 speakers representing 107 Swedish dialects. Each recording consists of two major parts. One part consisting of controlled material where specific aspects of Swedish phonology are elicited and one part containing spontaneous speech in the form of informal interviews or dialogues between two speakers of the dialect.
[occitan (post 1500) -> provençal; occitan (post 1500) -> provençal alpin ou nord-occitan; occitan (post 1500) -> patois de Valbonnais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Enregistrements son/vidéo réalisés dans le cadre du projet « Mémoires et pratiques linguistiques en zone de transition entre francoprovençal et occitan : Valjouffrey et Valbonnais »
Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Enregistrements son/vidéo réalisés dans le cadre du projet « Mémoires et pratiques linguistiques en zone de transition entre francoprovençal et occitan : Valjouffrey et Valbonnais »
Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Aix-MARSEC est une base de données évolutive de l'anglais britannique parlé.
Il est constitué de plus de cinq heures d'enregistrements accompagnés d'annotations à plusieurs niveaux linguistiques.
Ces annotations comportent actuellement les phonèmes, syllabes, constituants syllabiques, unités rythmiques, pieds accentuels, mots, unités intonatives, ainsi que la sortie des algorithmes automatiques de modélisation MOMEL et de codage symbolique INTSINT.
L'annotation est disponibleà la fois sous forme de TextGrids Praat et sous forme tabulaire dans un fichier texte ascii.
Domaine(s) linguistique(s) : speech_prosody, phonology, phonetics
Aix-MARSEC est une base de données évolutive de l'anglais britannique parlé.
Il est constitué de plus de cinq heures d'enregistrements accompagnés d'annotations à plusieurs niveaux linguistiques.
Ces annotations comportent actuellement les phonèmes, syllabes, constituants syllabiques, unités rythmiques, pieds accentuels, mots, unités intonatives, ainsi que la sortie des algorithmes automatiques de modélisation MOMEL et de codage symbolique INTSINT.
L'annotation est disponibleà la fois sous forme de TextGrids Praat et sous forme tabulaire dans un fichier texte ascii.
Domaine(s) linguistique(s) : speech_prosody, phonology, phonetics
[kattu nayaka] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus constitué de quatre entretiens semi-directifs bilingues (anglais et kattu nayaka/jenu kurumba) portant sur les représentations sociales des participants.
Oriana Reid-Collins a mené ces entretiens à Gudalur, Nilgiris, Tamil Nadu, Inde, entre mars et mai 2010.
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics
Corpus constitué de quatre entretiens semi-directifs bilingues (anglais et kattu nayaka/jenu kurumba) portant sur les représentations sociales des participants.
Oriana Reid-Collins a mené ces entretiens à Gudalur, Nilgiris, Tamil Nadu, Inde, entre mars et mai 2010.
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics
[anglais; français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus de lecture : 40 passages d'une minute environ en français et en anglais (corpus EUROM 1). Les passages en français sont lus par des natifs français et des apprenants anglophones, les passages en anglais sont lus par des natifs anglophones et des apprenants francophones.
Corpus de lecture : 40 passages d'une minute environ en français et en anglais (corpus EUROM 1). Les passages en français sont lus par des natifs français et des apprenants anglophones, les passages en anglais sont lus par des natifs anglophones et des apprenants francophones.
[français] Unité de Recherche Interdisciplinaire Octogone - EA4156 (Toulouse FR)
Corpus résultant d'enregistrements longitudinaux de cours de correction phonétique en Français Langue Étrangère (FLE) entre avril et juin 2011.
Corpus constitué de 96 heures de cours avec des apprenants anglophones de niveaux débutant et intermédiaire, selon deux méthodes de correction phonétique (Méthode Verbo-Tonale et Méthode Articulatoire).
Les enregistrements ontété réalisés dans le studio vidéo de la Direction des Technologies de l'Information et de la Communication pour l'Enseignement (DTICE) à l'Université Toulouse II.
La durée de chaque cours est de 90 minutes environ.
Corpus résultant d'enregistrements longitudinaux de cours de correction phonétique en Français Langue Étrangère (FLE) entre avril et juin 2011.
Corpus constitué de 96 heures de cours avec des apprenants anglophones de niveaux débutant et intermédiaire, selon deux méthodes de correction phonétique (Méthode Verbo-Tonale et Méthode Articulatoire).
Les enregistrements ontété réalisés dans le studio vidéo de la Direction des Technologies de l'Information et de la Communication pour l'Enseignement (DTICE) à l'Université Toulouse II.
La durée de chaque cours est de 90 minutes environ.
[bichelamar] Centre de Recherche et de Documentation sur l'Océanie - UMR 7308 (CREDO, Marseille FR)
Traitement automatique du langageécrit et parlé, Laboratoire d'informatique fondamentale (TALEP, Marseille FR)
Ce corpus contient de nombreuses histoires et chansons dans la langue de Ronivier et traduites en bislama. Il contient aussi de nombreuxéléments de grammaire de la langue de Ronivier puis traduits. Enfin, il y a de nombreuses photos d'arbres et d'oiseaux dont les noms ont été enregistrés dans la langue.
Traitement automatique du langageécrit et parlé, Laboratoire d'informatique fondamentale (TALEP, Marseille FR)
Ce corpus contient de nombreuses histoires et chansons dans la langue de Ronivier et traduites en bislama. Il contient aussi de nombreuxéléments de grammaire de la langue de Ronivier puis traduits. Enfin, il y a de nombreuses photos d'arbres et d'oiseaux dont les noms ont été enregistrés dans la langue.
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Le corpus DySpoLec est un corpus audio constitué de l'enregistrement de 19 enfants, normo lecteurs et dyslexiques, âgés de 10-11 ans. Destiné à l'étude des particularités prosodiques associées à la dyslexie, ce corpus propose l'enregistrement audio de chacun des sujets au cours d'une tâche de production de récit à partir d'images (parole spontanée) et d'une tâche de lecture (parole lue). La durée totale du corpus est d'environ 40 minutes ; les durées de production peuvent varier de 24 secondes à 2,30 minutes selon les sujets.
Le corpus DySpoLec est un corpus audio constitué de l'enregistrement de 19 enfants, normo lecteurs et dyslexiques, âgés de 10-11 ans. Destiné à l'étude des particularités prosodiques associées à la dyslexie, ce corpus propose l'enregistrement audio de chacun des sujets au cours d'une tâche de production de récit à partir d'images (parole spontanée) et d'une tâche de lecture (parole lue). La durée totale du corpus est d'environ 40 minutes ; les durées de production peuvent varier de 24 secondes à 2,30 minutes selon les sujets.
[occitan (post 1500)] Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Enquête sociolinguistique réalisée au cours de l'année 2011, autour d'une locutrice du "patois" et de son entourage, visant à :
- rassembler différents éléments de description de la langue et de ses usages dans le village aujourd'hui
- construire un corpus audio d'interactions spontanées en patois et en français, et de discours autour de la langue, de ses limites géographiques, de la culture paysanne et des diverses mémoires des locuteurs.
Domaine(s) linguistique(s) : sociolinguistics
Enquête sociolinguistique réalisée au cours de l'année 2011, autour d'une locutrice du "patois" et de son entourage, visant à :
- rassembler différents éléments de description de la langue et de ses usages dans le village aujourd'hui
- construire un corpus audio d'interactions spontanées en patois et en français, et de discours autour de la langue, de ses limites géographiques, de la culture paysanne et des diverses mémoires des locuteurs.
Domaine(s) linguistique(s) : sociolinguistics
[français] Linguistics and English Language (LEL, Edinburgh UK)
French corpus of laboratory speech, designed to test the role of prosodic cues (specifically the Initial Accent in French) in disambiguating syntactically ambiguous sentences (similar to the 'Old men and women' paradigm). Approx. 3000 sentences, varying in constituants' length and syntactic scope.
French corpus of laboratory speech, designed to test the role of prosodic cues (specifically the Initial Accent in French) in disambiguating syntactically ambiguous sentences (similar to the 'Old men and women' paradigm). Approx. 3000 sentences, varying in constituants' length and syntactic scope.
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
ProZed is a tool designed to allow linguists to manipulate the prosody of an utterance via a symbolic representation in order to evaluate linguistic models.
Prosody is manipulated via a Praat TextGrid which allows the user to modify the rhythm and melody.
Rhythm is manipulated by factoring segmental duration into three components: (i) intrinsic duration determined by phonemic identity (ii) local modifications encoded in the Rhythm unit and (iii) global variations of tempo encoded in the Intonation Unit.
Melody is similarly determined by tonal segments in the Tonal Unit (corresponding to pitch accents) and the Intonation Unit (corresponding to boundary tones) together with global parameters of \emph{key} and \emph{span} determining changes of pitch register.
The TextGrid is used to generate a Manipulation object which allows an immediate interactive assessment of the prosody determined by the annotation.
ProZed is a tool designed to allow linguists to manipulate the prosody of an utterance via a symbolic representation in order to evaluate linguistic models.
Prosody is manipulated via a Praat TextGrid which allows the user to modify the rhythm and melody.
Rhythm is manipulated by factoring segmental duration into three components: (i) intrinsic duration determined by phonemic identity (ii) local modifications encoded in the Rhythm unit and (iii) global variations of tempo encoded in the Intonation Unit.
Melody is similarly determined by tonal segments in the Tonal Unit (corresponding to pitch accents) and the Intonation Unit (corresponding to boundary tones) together with global parameters of \emph{key} and \emph{span} determining changes of pitch register.
The TextGrid is used to generate a Manipulation object which allows an immediate interactive assessment of the prosody determined by the annotation.
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Livre.
Auteur: Jassem, Wiktor.
Date: 1952.
Titre: Intonation of Colloquial English (Educated Southern British).
Editeur: Wroc?aw, Nak?adem Wroc?awskiego Towarzystwa Naukowego; Sk?ad Glówny: Dom Ksi?zki.
Series: Prace Wrock?awskiego Towarzystwa Naukowego. Travaux de la Société des Sciences et de Lettres de Wrock?aw Seria A.
Numéro: 45.
Pages: 122
Domaine(s) linguistique(s) : phonetics, general_linguistics
Livre.
Auteur: Jassem, Wiktor.
Date: 1952.
Titre: Intonation of Colloquial English (Educated Southern British).
Editeur: Wroc?aw, Nak?adem Wroc?awskiego Towarzystwa Naukowego; Sk?ad Glówny: Dom Ksi?zki.
Series: Prace Wrock?awskiego Towarzystwa Naukowego. Travaux de la Société des Sciences et de Lettres de Wrock?aw Seria A.
Numéro: 45.
Pages: 122
Domaine(s) linguistique(s) : phonetics, general_linguistics
[occitan (post 1500) -> provençal; occitan (post 1500) -> provençal alpin ou nord-occitan; occitan (post 1500) -> patois de Valbonnais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Journées organisées à l'initiative de Mme Marcelle Bernard Brunel épouse René Péry, dans le prolongement de travaux de recherche sur les patois de Valbonnais et régions voisines.
Collection : Alternance codique [sldr000762] Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, language_documentation, lexicography
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Journées organisées à l'initiative de Mme Marcelle Bernard Brunel épouse René Péry, dans le prolongement de travaux de recherche sur les patois de Valbonnais et régions voisines.
Collection : Alternance codique [sldr000762] Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, language_documentation, lexicography
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Equipement, méthodes expérimentales et logiciels développés par le Laboratoire Parole et Langage (http://lpl-aix.fr)
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
Equipement, méthodes expérimentales et logiciels développés par le Laboratoire Parole et Langage (http://lpl-aix.fr)
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
[anglais] Department of Psychology, Ohio State University (Columbus US)
Ce corpus contient des enregistrements de haute qualité de 40 locuteurs de Columbus (Ohio) en interactions spontanées avec un enquêteur. Le signal de parole a fait l'objet d'une transcription orthographique et d'un étiquetage phonétique. Les fichiers audio et textes, ainsi que les étiquetages phonétiques alignés sur le signal, sont préservésdans un format permettant leur utilisation avec des logiciels d'analyse de la parole (Xwaves and Wavesurfer). Un logiciel de requête dans les fichiers de transcription est inclus.
La documentation la plus récente est disponible sur le site http://buckeyecorpus.osu.edu.
Domaine(s) linguistique(s) : computational_linguistics, phonetics, phonology
Ce corpus contient des enregistrements de haute qualité de 40 locuteurs de Columbus (Ohio) en interactions spontanées avec un enquêteur. Le signal de parole a fait l'objet d'une transcription orthographique et d'un étiquetage phonétique. Les fichiers audio et textes, ainsi que les étiquetages phonétiques alignés sur le signal, sont préservésdans un format permettant leur utilisation avec des logiciels d'analyse de la parole (Xwaves and Wavesurfer). Un logiciel de requête dans les fichiers de transcription est inclus.
La documentation la plus récente est disponible sur le site http://buckeyecorpus.osu.edu.
Domaine(s) linguistique(s) : computational_linguistics, phonetics, phonology
[français] School of Psychology, Liège University (Liège BE)
Chant populaire interprété par 166 francophones non musiciens. Les participants ont produit la mélodie « Joyeux Anniversaire » de manière spontanée, sans tonalité imposée, après la production de deux glissendi (production de façon continue d'une note en partant du plus grave vers le plus aigu, couvrant ainsi latessiture du sujet). L'objectif de ces glissendi est d'échauffer l'appareil vocal, de vérifier la capacité vocale des sujets et de permettre une désinhibition face à l'expérimentateur et à l'équipement d'enregistrement.
Chant populaire interprété par 166 francophones non musiciens. Les participants ont produit la mélodie « Joyeux Anniversaire » de manière spontanée, sans tonalité imposée, après la production de deux glissendi (production de façon continue d'une note en partant du plus grave vers le plus aigu, couvrant ainsi latessiture du sujet). L'objectif de ces glissendi est d'échauffer l'appareil vocal, de vérifier la capacité vocale des sujets et de permettre une désinhibition face à l'expérimentateur et à l'équipement d'enregistrement.
[français] Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus résultant d'une enquête de terrain réalisée à Marseille.
Corpus constitué de 10 entretiens semi-directifs réalisés avec des informateurs nés à Marseille, entre janvier et novembre 2007.
Tous les informateurs sont francophones natifs, nés et résidant à Marseille. Les autres critères pris en compte dans l'échantillonnage sont le sexe, l'âge et la catégorie socioprofessionnelle.
Les enregistrements ont eu lieu au domicile des informateurs ou sur leur lieu de travail.
La durée de chaque entretien varie entre 12 et 30 minutes.
Corpus apparenté : voir http://sldr.org/sldr000020
Domaine(s) linguistique(s) : sociolinguistics, discourse_analysis
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus résultant d'une enquête de terrain réalisée à Marseille.
Corpus constitué de 10 entretiens semi-directifs réalisés avec des informateurs nés à Marseille, entre janvier et novembre 2007.
Tous les informateurs sont francophones natifs, nés et résidant à Marseille. Les autres critères pris en compte dans l'échantillonnage sont le sexe, l'âge et la catégorie socioprofessionnelle.
Les enregistrements ont eu lieu au domicile des informateurs ou sur leur lieu de travail.
La durée de chaque entretien varie entre 12 et 30 minutes.
Corpus apparenté : voir http://sldr.org/sldr000020
Domaine(s) linguistique(s) : sociolinguistics, discourse_analysis
[français] Centre de linguistique appliquée (CLA, Neuchâtel CH)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus résultant d'une enquête de terrain réalisée à Lausanne (Canton de Vaud, Suisse) en 2007.
Corpus constitué de 10 entretiens semi-directifs réalisés avec des locuteurs lausannois.
Tous les informateurs sont francophones natifs. Ils sont nés et résident à Lausanne. Les autres critères pris en compte dans l'échantillonnage sont le sexe, l'âge et la catégorie socioprofessionnelle.
Les enregistrements ont eu lieu soit au domicile des informateurs, soit sur leur lieu de travail, soit dans des espaces publics.
La durée des entretiens varie entre 12 et 43 minutes.
Corpus apparenté : voir http://sldr.org/sldr000019
Domaine(s) linguistique(s) : sociolinguistics, discourse_analysis
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus résultant d'une enquête de terrain réalisée à Lausanne (Canton de Vaud, Suisse) en 2007.
Corpus constitué de 10 entretiens semi-directifs réalisés avec des locuteurs lausannois.
Tous les informateurs sont francophones natifs. Ils sont nés et résident à Lausanne. Les autres critères pris en compte dans l'échantillonnage sont le sexe, l'âge et la catégorie socioprofessionnelle.
Les enregistrements ont eu lieu soit au domicile des informateurs, soit sur leur lieu de travail, soit dans des espaces publics.
La durée des entretiens varie entre 12 et 43 minutes.
Corpus apparenté : voir http://sldr.org/sldr000019
Domaine(s) linguistique(s) : sociolinguistics, discourse_analysis
[occitan (post 1500)] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
1) Documentation et description d'une langue en voie d'extinction : le patois/parler/dialecte de Valjouffrey ;
2) Construction d'un corpus audio/vidéo multi-locuteurs de parole spontanée répondant aux besoins spécifiques de travaux sur la prosodie, la mimo-gestualité, les interactions langagières et communicatives, ainsi que la comparaison des langues ;
3) Enquête sociolinguistique, culturelle et historique sur la région de Valjouffrey.
Collection : Valjouffrey [valjouffrey-000007] Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
1) Documentation et description d'une langue en voie d'extinction : le patois/parler/dialecte de Valjouffrey ;
2) Construction d'un corpus audio/vidéo multi-locuteurs de parole spontanée répondant aux besoins spécifiques de travaux sur la prosodie, la mimo-gestualité, les interactions langagières et communicatives, ainsi que la comparaison des langues ;
3) Enquête sociolinguistique, culturelle et historique sur la région de Valjouffrey.
Collection : Valjouffrey [valjouffrey-000007] Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Petits multilogues (4 personnes) enregistrés en chambre sourde avec micro-casque. La situation est une partie du jeu de négociation "Carambouille".
Petits multilogues (4 personnes) enregistrés en chambre sourde avec micro-casque. La situation est une partie du jeu de négociation "Carambouille".
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
PHONEDIT Signaix est un logiciel d'analyse de signaux sonore, aérodynamique, articulatoire et électro-physiologique développé par le laboratoire "Parole et Langage", Aix-en-Provence, France. Il fournit un environnement complet pour l'enregistrement, la lecture, l'affichage, l'analyse, l'annotation de données multiparamétriques.
La version 2009 autorise le contrôle de la station de travail EVA2. Il est possible d'enregistrer directement des données aérodynamiques provenant des capteurs d'EVA2 avec Phonedit (Utiliser le menu "Outils" pour sélectionner le dispositif d'enregistrement).
Les modules d'extension de PHONEDIT Signaix peuventêtre utilisés dans l'environnement Linux/Cygwin pour personnaliser des traitement à travers des scripts bash.
PHONEDIT Signaix fonctionne avec les versions récentes de Microsoft Windows sur PC .
PHONEDIT Signaix est gratuit et téléchargeable.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
PHONEDIT Signaix est un logiciel d'analyse de signaux sonore, aérodynamique, articulatoire et électro-physiologique développé par le laboratoire "Parole et Langage", Aix-en-Provence, France. Il fournit un environnement complet pour l'enregistrement, la lecture, l'affichage, l'analyse, l'annotation de données multiparamétriques.
La version 2009 autorise le contrôle de la station de travail EVA2. Il est possible d'enregistrer directement des données aérodynamiques provenant des capteurs d'EVA2 avec Phonedit (Utiliser le menu "Outils" pour sélectionner le dispositif d'enregistrement).
Les modules d'extension de PHONEDIT Signaix peuventêtre utilisés dans l'environnement Linux/Cygwin pour personnaliser des traitement à travers des scripts bash.
PHONEDIT Signaix fonctionne avec les versions récentes de Microsoft Windows sur PC .
PHONEDIT Signaix est gratuit et téléchargeable.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
[vietnamien] Vietnam National University (VNU, Hanoi VN)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Il s'agit d'un corpus de dix interactions verbales en vietnamien et en français produites par trois groupes de pairs lors de leurs séances de révision collaborative étayée.
Domaine(s) linguistique(s) : language_acquisition
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Il s'agit d'un corpus de dix interactions verbales en vietnamien et en français produites par trois groupes de pairs lors de leurs séances de révision collaborative étayée.
Domaine(s) linguistique(s) : language_acquisition
[français] Département de lettres modernes, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus audio de 4 entretiens semi-dirigés (environ 5h30 au total).
Les entretiens portent sur la féminisation des textes (double-marquage) en contexte politique libertaire, avec des locuteurs issus de ces cultures politiques.
Productions métadiscursives sur les stratégies de féminisation des locuteurs.
Domaine(s) linguistique(s) : applied_linguistics, morphology, discourse_analysis, sociolinguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus audio de 4 entretiens semi-dirigés (environ 5h30 au total).
Les entretiens portent sur la féminisation des textes (double-marquage) en contexte politique libertaire, avec des locuteurs issus de ces cultures politiques.
Productions métadiscursives sur les stratégies de féminisation des locuteurs.
Domaine(s) linguistique(s) : applied_linguistics, morphology, discourse_analysis, sociolinguistics
[français] Département de lettres modernes, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus de 6 brochures regroupant un total de 15 textes, portant sur la culture, le genre, l'action directe, les black blocs, l'antispécisme, ...
La plupart des textes connaissent des modifications morphosyntaxiques transgressives du genre masculin/féminin.
Domaine(s) linguistique(s) : applied_linguistics, morphology, discourse_analysis
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus de 6 brochures regroupant un total de 15 textes, portant sur la culture, le genre, l'action directe, les black blocs, l'antispécisme, ...
La plupart des textes connaissent des modifications morphosyntaxiques transgressives du genre masculin/féminin.
Domaine(s) linguistique(s) : applied_linguistics, morphology, discourse_analysis
[anglais] Department of Computer Science, Vassar College (New York US)
Le projet American National Corpus (ANC) est en train de rassembler une collection volumineuse sur l'anglais américain qui comprend des textes de tous genres et des transcriptions de paroles à partir de 1990. L'ANC fournira l'image la plus complète de l'anglais américain construite à ce jour, servant de ressource pour l'enseignement, la recherche linguistique et lexicographique, ainsi que les technologies de la langue. Ce fragment en libre accès de l'American National Corpus (OANC) contient environ 15 millions de mots du corpus d'origine.
Domaine(s) linguistique(s) : text_and_corpus_linguistics, discourse_analysis, language_documentation
Le projet American National Corpus (ANC) est en train de rassembler une collection volumineuse sur l'anglais américain qui comprend des textes de tous genres et des transcriptions de paroles à partir de 1990. L'ANC fournira l'image la plus complète de l'anglais américain construite à ce jour, servant de ressource pour l'enseignement, la recherche linguistique et lexicographique, ainsi que les technologies de la langue. Ce fragment en libre accès de l'American National Corpus (OANC) contient environ 15 millions de mots du corpus d'origine.
Domaine(s) linguistique(s) : text_and_corpus_linguistics, discourse_analysis, language_documentation
[occitan (post 1500)] Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus audio/vidéo enregistré à St-Rémy-de-Provence dans le cadre du projet (Re)parler « sa » langue, l'alternance codique, à la recherche de langues « oubliées ».
Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : sociolinguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus audio/vidéo enregistré à St-Rémy-de-Provence dans le cadre du projet (Re)parler « sa » langue, l'alternance codique, à la recherche de langues « oubliées ».
Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : sociolinguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
8 dilogues avec les données suivantes :
+ fichiers sons des micro-casques : un fichier par locuteur
+ annotation des unités inter-pausales (IPU)
+ transcription orthographique enrichie (TOE) des IPU, alignée avec le signal audio
+ transcription phonétique alignée avec le signal audio
+ syllabes alignées avec le signal audio
+ tokens alignés avec le signal
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody, general_linguistics
8 dilogues avec les données suivantes :
+ fichiers sons des micro-casques : un fichier par locuteur
+ annotation des unités inter-pausales (IPU)
+ transcription orthographique enrichie (TOE) des IPU, alignée avec le signal audio
+ transcription phonétique alignée avec le signal audio
+ syllabes alignées avec le signal audio
+ tokens alignés avec le signal
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody, general_linguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Script PRAAT.
Objet : remplacer les fragments d'un "long sound"étiquetés par un mot-clé par un son murmuré dont les caractéristiques prosodiques sont identiques à celles du son original.
Le fichier source peutêtre mono ou stéréo, sans incidence sur le résultat.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation, speech_prosody, computational_linguistics
Script PRAAT.
Objet : remplacer les fragments d'un "long sound"étiquetés par un mot-clé par un son murmuré dont les caractéristiques prosodiques sont identiques à celles du son original.
Le fichier source peutêtre mono ou stéréo, sans incidence sur le résultat.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation, speech_prosody, computational_linguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Extrait de la vidéo de la 2e séance du 4 mai 2010. Le débat sur le « Grenelle II de l'environnement » a été sélectionné en raison de la controverse importante qu'il a déclenchée. Le député Vert Yves Cochet y fait une intervention, de laquelle nous avons retenu 4 minutes 50 secondes.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
Extrait de la vidéo de la 2e séance du 4 mai 2010. Le débat sur le « Grenelle II de l'environnement » a été sélectionné en raison de la controverse importante qu'il a déclenchée. Le député Vert Yves Cochet y fait une intervention, de laquelle nous avons retenu 4 minutes 50 secondes.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
[langue des signes française; français] Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur - UPR 3251 (Limsi, Orsay FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Le corpus DEGELS1 est un corpus comparable de dialogues en langue des signes française et en français oral (voix et gestes). Le thème des dialogues est la description d'itinéraires et de lieux à Marseille et à Aix-en-Provence. Le corpus est composé de trois dialogues en LSF et trois dialogues en français. Chaque diade est composée d'un modérateur et d'un locuteur. Il ya un unique modérateur pour le français et deux modérateurs pour la LSF. Le matériel d'enregistrement est composé de trois caméras, et de deux microphones serre-tête. L'enregistrement a été fait dans la chambre sourde du LPL.
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Le corpus DEGELS1 est un corpus comparable de dialogues en langue des signes française et en français oral (voix et gestes). Le thème des dialogues est la description d'itinéraires et de lieux à Marseille et à Aix-en-Provence. Le corpus est composé de trois dialogues en LSF et trois dialogues en français. Chaque diade est composée d'un modérateur et d'un locuteur. Il ya un unique modérateur pour le français et deux modérateurs pour la LSF. Le matériel d'enregistrement est composé de trois caméras, et de deux microphones serre-tête. L'enregistrement a été fait dans la chambre sourde du LPL.
[occitan (post 1500)] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Enregistrements de patois de Chantelouve (38)
Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : sociolinguistics, language_documentation
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Enregistrements de patois de Chantelouve (38)
Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : sociolinguistics, language_documentation
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Productions et projets en lien avec le thème de l'alternance codique (code-switching) en parole multilingue
Domaine(s) linguistique(s) : sociolinguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Productions et projets en lien avec le thème de l'alternance codique (code-switching) en parole multilingue
Domaine(s) linguistique(s) : sociolinguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Ces annotations concernent l'intervention d'Yves Cochetà l'Assemblée nationale lors de la 2e séance du 4 mai 2010, qui porte sur le "Grenelle II de l'environnement".
À partir de la vidéo, nous avons abordé, selon une approche multimodale, les réactions aux interruptions polémiques de l'hémicycle.
Après avoir été transcrit manuellement, le corpus a été annoté automatiquement en phonétique (phonèmes, syllabes, mots) et en syntaxe (morpho-syntaxe, catégories, groupes et ponctuation) et il a été annoté manuellement en prosodie (contours intonatifs et tons), en gestes co-verbaux (type degeste principal et secondaire, manualité), ainsi que les auto-répétitions, et les réponses aux interruptions.
Toutes ces annotations sont fournies au format TextGrid.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
Ces annotations concernent l'intervention d'Yves Cochetà l'Assemblée nationale lors de la 2e séance du 4 mai 2010, qui porte sur le "Grenelle II de l'environnement".
À partir de la vidéo, nous avons abordé, selon une approche multimodale, les réactions aux interruptions polémiques de l'hémicycle.
Après avoir été transcrit manuellement, le corpus a été annoté automatiquement en phonétique (phonèmes, syllabes, mots) et en syntaxe (morpho-syntaxe, catégories, groupes et ponctuation) et il a été annoté manuellement en prosodie (contours intonatifs et tons), en gestes co-verbaux (type degeste principal et secondaire, manualité), ainsi que les auto-répétitions, et les réponses aux interruptions.
Toutes ces annotations sont fournies au format TextGrid.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Extrait de la vidéo de la 2e séance du 4 mai 2010. Le débat sur le « Grenelle II de l'environnement » a été sélectionné en raison de la controverse importante qu'il a déclenchée. Le député Vert Yves Cochet y fait une intervention, de laquelle nous avons retenu 4 minutes du moment le plus vif de la controverse, où le député est interrompu à 11 reprises.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
Extrait de la vidéo de la 2e séance du 4 mai 2010. Le débat sur le « Grenelle II de l'environnement » a été sélectionné en raison de la controverse importante qu'il a déclenchée. Le député Vert Yves Cochet y fait une intervention, de laquelle nous avons retenu 4 minutes du moment le plus vif de la controverse, où le député est interrompu à 11 reprises.
Collection : Multimodalité et débats à l'Assemblée nationale [sldr000729]
Domaine(s) linguistique(s) : text_and_corpus_linguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Cette ressource concerne l'intervention de Yves Cochetà l'Assemblée nationale le 4 mai 2010, lors du débat sur le Grenelle II sur l'environnement.
Elle regroupe deux données : l'audio et la vidéo de 4 minutes du moment le plus vif du débat et des annotations multimodales de grande qualité : 16 tires d'annotations sont fournies au format TextGrid (transcription, phonétique, syntaxe, prosodie, geste, et autres).
Domaine(s) linguistique(s) : text_and_corpus_linguistics
Cette ressource concerne l'intervention de Yves Cochetà l'Assemblée nationale le 4 mai 2010, lors du débat sur le Grenelle II sur l'environnement.
Elle regroupe deux données : l'audio et la vidéo de 4 minutes du moment le plus vif du débat et des annotations multimodales de grande qualité : 16 tires d'annotations sont fournies au format TextGrid (transcription, phonétique, syntaxe, prosodie, geste, et autres).
Domaine(s) linguistique(s) : text_and_corpus_linguistics
[occitan (post 1500); occitan (post 1500) -> provençal alpin ou nord-occitan] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
1) Traductions, transcriptions et annotations des corpus de patois de Valjouffrey
2) Fichiers sonores, vidéos et annotations/sous-titrage accessibles publiquement pour le streaming
Collection : Valjouffrey [valjouffrey-000007] Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics, text_and_corpus_linguistics, phonology, phonetics
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
1) Traductions, transcriptions et annotations des corpus de patois de Valjouffrey
2) Fichiers sonores, vidéos et annotations/sous-titrage accessibles publiquement pour le streaming
Collection : Valjouffrey [valjouffrey-000007] Collection : Alternance codique [sldr000762]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics, text_and_corpus_linguistics, phonology, phonetics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Système international de transcription de l'intonation (INternational Transcription System for INTonation)
Domaine(s) linguistique(s) : linguistic_theories, computational_linguistics, speech_prosody
Système international de transcription de l'intonation (INternational Transcription System for INTonation)
Domaine(s) linguistique(s) : linguistic_theories, computational_linguistics, speech_prosody
[franco-provençal -> patois matheysin] Ce carnet de 199 pages est une monographie sur le village de Notre-Dame de Vaulx, une commune française située dans le département de l'Isère et la région Rhône-Alpes, rédigée par M. J.D. CHAUPIN. Achevé en mai 1958, il est dédicacé à sa petite fille Danielle Marthe CHAUPIN. Il contient sur une cinquantaine de pages un glossaire de plus de 1500 mots ainsi que les expressions les plus courantes en patois matheysin.
La version déposée ici est une photocopie de seconde génération du manuscrit réalisée par Jacqueline DUC, spécialiste des patois matheysins.
Domaine(s) linguistique(s) : language_documentation
La version déposée ici est une photocopie de seconde génération du manuscrit réalisée par Jacqueline DUC, spécialiste des patois matheysins.
Domaine(s) linguistique(s) : language_documentation
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
A set of French dialogues elicited with the MAPTASK protocol.
Alignment at the utterance level.
The recording and the transcription have been done in the Framework of Corine Astésano's Marie-Curie Fellowship.
Astésano, C.; Bard, E.; Turk, A. (2007). Structural influences on Initial Accent placement in French. Language and Speech, 50 (3), 423-446
A set of French dialogues elicited with the MAPTASK protocol.
Alignment at the utterance level.
The recording and the transcription have been done in the Framework of Corine Astésano's Marie-Curie Fellowship.
Astésano, C.; Bard, E.; Turk, A. (2007). Structural influences on Initial Accent placement in French. Language and Speech, 50 (3), 423-446
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Le CID (Corpus d'interactions dialogales / Corpus of Interactional Data) est un corpus audio-video de 8 heures, en français, destiné à l'annotation multimodale qui inclut la phonétique, la prosodie, la morphologie, la syntaxe, le discours et la mimo-gestualité.
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody
Le CID (Corpus d'interactions dialogales / Corpus of Interactional Data) est un corpus audio-video de 8 heures, en français, destiné à l'annotation multimodale qui inclut la phonétique, la prosodie, la morphologie, la syntaxe, le discours et la mimo-gestualité.
Domaine(s) linguistique(s) : phonology, phonetics, speech_prosody
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Enrichissements du corpus EUROM_1
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonetics, phonology, speech_prosody, syntax
Enrichissements du corpus EUROM_1
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonetics, phonology, speech_prosody, syntax
UCL division of psychology and language sciences (UCL, London UK)
A Praat script for large-scale systematic prosody analysis
Domaine(s) linguistique(s) : computational_linguistics
A Praat script for large-scale systematic prosody analysis
Domaine(s) linguistique(s) : computational_linguistics
UCL division of psychology and language sciences (UCL, London UK)
A Praat script for extracting pitch targets from vocal signals
Domaine(s) linguistique(s) : computational_linguistics
A Praat script for extracting pitch targets from vocal signals
Domaine(s) linguistique(s) : computational_linguistics
[anglais] Centre de sciences humaines (CSH, New Delhi IN)
Conférence de Jacques Derrida sur Antonin Artaud. Séminaire In homage to Antonin Artaud organisé à New Delhi par National School of Drama, Delhi University et l'Ambassade de France, le 23 janvier 1997.
Domaine(s) linguistique(s) : philosophy_of_language
Conférence de Jacques Derrida sur Antonin Artaud. Séminaire In homage to Antonin Artaud organisé à New Delhi par National School of Drama, Delhi University et l'Ambassade de France, le 23 janvier 1997.
Domaine(s) linguistique(s) : philosophy_of_language
[anglais] Centre de sciences humaines (CSH, New Delhi IN)
"State of the Lie, Lie of the State" (État du mensonge, mensonge d'État). Conférence de Jacques Derrida à Delhi School of Economics le 24 janvier 1997.
Domaine(s) linguistique(s) : philosophy_of_language
"State of the Lie, Lie of the State" (État du mensonge, mensonge d'État). Conférence de Jacques Derrida à Delhi School of Economics le 24 janvier 1997.
Domaine(s) linguistique(s) : philosophy_of_language
[anglais; français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Issu d'une collaboration entre le Laboratoire Parole et Langage (LPL) et l'Institut de Plongée Professionnelle de Marseille (INPP) en 1991, le corpus PSH/DISPE répond à la demande d'une base de sons pour le développement de nouveaux procédés de « décodage » de la parole hyperbare, et d'un outil pour l'évaluation des systèmes de communication vocale.
Les fichiers d'annotations sont conformes au format standard SAM Europec du projet CEE-ESPRIT n°2589.
Issu d'une collaboration entre le Laboratoire Parole et Langage (LPL) et l'Institut de Plongée Professionnelle de Marseille (INPP) en 1991, le corpus PSH/DISPE répond à la demande d'une base de sons pour le développement de nouveaux procédés de « décodage » de la parole hyperbare, et d'un outil pour l'évaluation des systèmes de communication vocale.
Les fichiers d'annotations sont conformes au format standard SAM Europec du projet CEE-ESPRIT n°2589.
[vietnamien] Multimedia, Information, Communication and Applications - UMI 2954 (MICA, Hanoi VN)
Données collectées dans le cadre d'un premier terrain à N?m Tu Thu??ng chez les M? Piu entre le 8 et 12 juin 2009. Les corpus parole, chants, morceaux de musique, enregistrés sont répertoriés par jour, thème, locuteur, question (chant ou morceau instrumental de musique). A chaque couple question/réponse correspond un fichier wav. Les enregistrements ont été effectués en stéréo. Sur une piste le jour, le thème, le locuteur et le numéro de la question sont rappelés, suivis par une question en vietnamien (posée par un Vietnamien). Sur la seconde piste, en M? Piu, la même question est ensuite posée suivie de la réponse.
4 locuteurs, 3 locutrices, 7 chanteuses et 2 chanteurs ontété enregistrés. Soit au total, 7 heures de paroles et 1 heure de chants.
Domaine(s) linguistique(s) : anthropological_linguistics
Données collectées dans le cadre d'un premier terrain à N?m Tu Thu??ng chez les M? Piu entre le 8 et 12 juin 2009. Les corpus parole, chants, morceaux de musique, enregistrés sont répertoriés par jour, thème, locuteur, question (chant ou morceau instrumental de musique). A chaque couple question/réponse correspond un fichier wav. Les enregistrements ont été effectués en stéréo. Sur une piste le jour, le thème, le locuteur et le numéro de la question sont rappelés, suivis par une question en vietnamien (posée par un Vietnamien). Sur la seconde piste, en M? Piu, la même question est ensuite posée suivie de la réponse.
4 locuteurs, 3 locutrices, 7 chanteuses et 2 chanteurs ontété enregistrés. Soit au total, 7 heures de paroles et 1 heure de chants.
Domaine(s) linguistique(s) : anthropological_linguistics
[marathi] Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)
Entretiens avec Gangu Ambore, une chanteuse lépreuse de Tadakalas, district de Parbhani au Maharashtra (Inde) le 5 février 1997. Gangubai exprime son affect par l'intermédiaire de chants de la mouture et de poèmes dévotionnels empruntés à une forme populaire de bhakti.
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, linguistics_and_literature, pragmatics
Entretiens avec Gangu Ambore, une chanteuse lépreuse de Tadakalas, district de Parbhani au Maharashtra (Inde) le 5 février 1997. Gangubai exprime son affect par l'intermédiaire de chants de la mouture et de poèmes dévotionnels empruntés à une forme populaire de bhakti.
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, linguistics_and_literature, pragmatics
[marathi; marathi -> marathi rural] Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)
Annotations du corpus Ambedkar et documents annexes.
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, historical_linguistics, discourse_analysis, speech_prosody
Annotations du corpus Ambedkar et documents annexes.
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, historical_linguistics, discourse_analysis, speech_prosody
Archive de travaux de Claire Blanche-Benveniste : espace de travail pour diffusion ultérieure de documents finalisés.
Domaine(s) linguistique(s) : general_linguistics, text_and_corpus_linguistics
Domaine(s) linguistique(s) : general_linguistics, text_and_corpus_linguistics
[français] Université de Genève, Département de linguistique (UNIGE, Genève CH)
Centre de recherche Valibel - Discours et variation (Valibel, Louvain BE)
Université de Neuchâtel (UniNE, Neuchâtel CH)
Modèles, dynamiques, corpus - UMR 7114 (MoDyCo, Paris FR)
C-PROM est un corpus aligné et annoté, développé pour l'étude des proéminences syllabiques en français. Il inclut 24 enregistrements échantillonnés en 7 genres (ou styles) de parole et produits par des locuteurs francophones (issus de Belgique, de France et de Suisse). Les données sonores (au format wav) sont accompagnées de fichiers d'annotation multi-niveaux (TextGrid) et de détection de F0 (Pitch).
Domaine(s) linguistique(s) : speech_prosody, phonetics, text_and_corpus_linguistics
Centre de recherche Valibel - Discours et variation (Valibel, Louvain BE)
Université de Neuchâtel (UniNE, Neuchâtel CH)
Modèles, dynamiques, corpus - UMR 7114 (MoDyCo, Paris FR)
C-PROM est un corpus aligné et annoté, développé pour l'étude des proéminences syllabiques en français. Il inclut 24 enregistrements échantillonnés en 7 genres (ou styles) de parole et produits par des locuteurs francophones (issus de Belgique, de France et de Suisse). Les données sonores (au format wav) sont accompagnées de fichiers d'annotation multi-niveaux (TextGrid) et de détection de F0 (Pitch).
Domaine(s) linguistique(s) : speech_prosody, phonetics, text_and_corpus_linguistics
[occitan (post 1500) -> patois de Valbonnais; occitan (post 1500); franco-provençal] Description lexicale et morphologique du patois de Valbonnais sous la forme d'un manuscrit de 319 pages.
Thèse sous la direction du Prof. Antonin DURAFFOUR (Univ. Stendhal, Grenoble, 1943)
Domaine(s) linguistique(s) : language_documentation, lexicography, morphology
Thèse sous la direction du Prof. Antonin DURAFFOUR (Univ. Stendhal, Grenoble, 1943)
Domaine(s) linguistique(s) : language_documentation, lexicography, morphology
[français; anglais; anglais -> anglais britannique; espagnol] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus trilingue Français/anglais/espagnol
+ Prononciation de voyelles isolées : toutes les voyelles du système de chaque langue
+ 10 exemplaires de chaque voyelle
+ Prononciation de mots monosyllabiques comprenant toutes les voyelles du système de chaque langue - 150 mots en espagnol
+ 4 locuteurs (2 hommes, 2 femmes) dans chaque langue (sauf français et espagnol, manque un locuteur masculin ? enregistrement prochain).
+ Enregistrement chambre sourde
Domaine(s) linguistique(s) : phonetics, phonology
Corpus trilingue Français/anglais/espagnol
+ Prononciation de voyelles isolées : toutes les voyelles du système de chaque langue
+ 10 exemplaires de chaque voyelle
+ Prononciation de mots monosyllabiques comprenant toutes les voyelles du système de chaque langue - 150 mots en espagnol
+ 4 locuteurs (2 hommes, 2 femmes) dans chaque langue (sauf français et espagnol, manque un locuteur masculin ? enregistrement prochain).
+ Enregistrement chambre sourde
Domaine(s) linguistique(s) : phonetics, phonology
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
60 locuteurs enregistrés en chambre sourde produisant 3 types d'exercices en anglais: lecture de 4 passages de textes choisis dans le corpus eurom 1, répétition de phrases (25) après un modèle natif et monologue sur un sujet libre.
Domaine(s) linguistique(s) : discourse_analysis, semantics, speech_prosody
60 locuteurs enregistrés en chambre sourde produisant 3 types d'exercices en anglais: lecture de 4 passages de textes choisis dans le corpus eurom 1, répétition de phrases (25) après un modèle natif et monologue sur un sujet libre.
Domaine(s) linguistique(s) : discourse_analysis, semantics, speech_prosody
[tibétain] Centre de sciences humaines (CSH, New Delhi IN)
Chants d'émigrés tibétains au Ladakh
Chants d'émigrés tibétains au Ladakh
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Ce corpus est un enregistrement d'une vingtaine de minutes d'une conversation informelle en anglais entre 4 locuteurs britanniques (2 femmes et 2 hommes), accompagné de sa transcription orthographique. Utilisé au départ pour l'étude de la prosodie de l'emphase, ce corpus de parole spontanée peut être utilisé pour l'analyse de tous les phénomènes en discours spontané.
Domaine(s) linguistique(s) : discourse_analysis, general_linguistics, phonetics
Ce corpus est un enregistrement d'une vingtaine de minutes d'une conversation informelle en anglais entre 4 locuteurs britanniques (2 femmes et 2 hommes), accompagné de sa transcription orthographique. Utilisé au départ pour l'étude de la prosodie de l'emphase, ce corpus de parole spontanée peut être utilisé pour l'analyse de tous les phénomènes en discours spontané.
Domaine(s) linguistique(s) : discourse_analysis, general_linguistics, phonetics
[tibétain] Centre de sciences humaines (CSH, New Delhi IN)
Ce« rituel de la pierre brisée » a été célébré en juillet 1996 pour fêter un événement heureux dans une maison de Choglamsar, un quartier de migrants tibétains en bordure de la ville de Leh (Ladakh, Inde). D'après les informateurs locaux, ses exécutants étaient des ermites vivant dansdes grottes du Spiti. Il s'agit d'un mélange intéressant entre rituel religieux, scènes comiques et démonstration de pouvoirs surnaturels.
Domaine(s) linguistique(s) : anthropological_linguistics
Ce« rituel de la pierre brisée » a été célébré en juillet 1996 pour fêter un événement heureux dans une maison de Choglamsar, un quartier de migrants tibétains en bordure de la ville de Leh (Ladakh, Inde). D'après les informateurs locaux, ses exécutants étaient des ermites vivant dansdes grottes du Spiti. Il s'agit d'un mélange intéressant entre rituel religieux, scènes comiques et démonstration de pouvoirs surnaturels.
Domaine(s) linguistique(s) : anthropological_linguistics
[anglais; sanskrit; persan; hindi; ourdou] Enregistrement intégral d'un séminaire au Département de musique, Banaras Hindu University (Bénarès, Inde) du 25 au 27 mars 1985. Le but de ce séminaire était d'initier un dialogue entre deux experts historiens de la musique indienne travaillant à partir de sources sanscrites et persanes : respectivement Dr.Prem Lata Sharma, directrice du Département de musique à BHU, et Dr. Shahab Sarmadee, associé au Département d'histoire d'Aligarh Muslim University. Ce dernier, né en 1914, a été engagé par l'International Society for Traditional Arts Research (ISTAR) pour éditer la première traduction enanglais du Mankutuhal et du Rag Darpan de Faquirullah.
[amis] Wenzao Ursuline College of Languages (WTUC, Taiwan TW)
Le peuple 'amis est un des peuples aborigènes de Taiwan. La langue 'amis est une langue austronésienne (groupe des langues formosanes), parlée par un peu plus de 100 000 locuteurs 'amis à Taiwan. Du fait de la politique linguistique du gouvernement taiwanais (sinisation), la déperdition de cette langue est très rapide. Une enquête aété réalisée auprès des 'Amis vivant en milieu urbain pour comprendre leurs usages linguistiques; ces usages concernent trois langues: la langue 'amis, la langue nationale (chinois mandarin) et la langue minnan (les Minnans sont le groupe majoritaire à Taiwan). Ce corpus comprend des entretiens de type sociolinguistique : 25 cassettes audio d'enregistrements de locuteurs amis vivant en milieu urbain interrogés dans des entretiens semi-directifs entre janvier 2002 et août 2003, plus des enregistrements en public (ou dans des églises chrétiennes) réalisés dans les villes de Hualienet Taipei.
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, language_documentation
Le peuple 'amis est un des peuples aborigènes de Taiwan. La langue 'amis est une langue austronésienne (groupe des langues formosanes), parlée par un peu plus de 100 000 locuteurs 'amis à Taiwan. Du fait de la politique linguistique du gouvernement taiwanais (sinisation), la déperdition de cette langue est très rapide. Une enquête aété réalisée auprès des 'Amis vivant en milieu urbain pour comprendre leurs usages linguistiques; ces usages concernent trois langues: la langue 'amis, la langue nationale (chinois mandarin) et la langue minnan (les Minnans sont le groupe majoritaire à Taiwan). Ce corpus comprend des entretiens de type sociolinguistique : 25 cassettes audio d'enregistrements de locuteurs amis vivant en milieu urbain interrogés dans des entretiens semi-directifs entre janvier 2002 et août 2003, plus des enregistrements en public (ou dans des églises chrétiennes) réalisés dans les villes de Hualienet Taipei.
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, language_documentation
[occitan (post 1500)] Description lexicale&morphologique du patois de Valjouffrey, sous la forme d'un mémoire de 215 pages intégralement enregistré (9 heures). Ce mémoire est accompagné de discussions et d'entretiens en patois enregistrés dans les années 1970-80.
Mémoire de 2e année du 2e cycle « Lettres modernes » (1969-70) sous la direction du Prof. Gaston TUAILLON (Univ. Stendhal, Grenoble). Une copie a été déposée à la bibliothèque de l'Université.
Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics, text_and_corpus_linguistics
Mémoire de 2e année du 2e cycle « Lettres modernes » (1969-70) sous la direction du Prof. Gaston TUAILLON (Univ. Stendhal, Grenoble). Une copie a été déposée à la bibliothèque de l'Université.
Collection : Valjouffrey [valjouffrey-000007]
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics, anthropological_linguistics, text_and_corpus_linguistics
[anglais; anglais -> anglais britannique] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Annotations du corpus ANGLISH
(En préparation)
Domaine(s) linguistique(s) : discourse_analysis, semantics, speech_prosody, phonology, phonetics
Annotations du corpus ANGLISH
(En préparation)
Domaine(s) linguistique(s) : discourse_analysis, semantics, speech_prosody, phonology, phonetics
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpus de dislocationsà droite en anglais composé de 20 phrases tirées de textes littéraires lues par six anglophones (hommes et femmes), ainsi que quelques exemples tirés de films, soit au total 1997 mots (126 enregistrements).
Domaine(s) linguistique(s) : speech_prosody
Corpus de dislocationsà droite en anglais composé de 20 phrases tirées de textes littéraires lues par six anglophones (hommes et femmes), ainsi que quelques exemples tirés de films, soit au total 1997 mots (126 enregistrements).
Domaine(s) linguistique(s) : speech_prosody
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Ce corpus d'apprenants consiste en la lecture non préparée de textes anglais par 54 étudiants francophones de première année de licence d'anglais. Les textes sont de courts extraits divers d'?uvres littéraires ou de textes fabriqués.
Domaine(s) linguistique(s) : phonetics, language_acquisition
Ce corpus d'apprenants consiste en la lecture non préparée de textes anglais par 54 étudiants francophones de première année de licence d'anglais. Les textes sont de courts extraits divers d'?uvres littéraires ou de textes fabriqués.
Domaine(s) linguistique(s) : phonetics, language_acquisition
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Ouvrage du Chanoine Victorin RATEL publié en 1956 par l'Institut de linguistique romane avec le concours du CNRS. Description du vocabulaire patois d'une vallée de la Maurienne.
Exemplaire disponibleà la bibliothèque de l'Université de Provence, centre Schuman, cote 3682.
Domaine(s) linguistique(s) : lexicography, anthropological_linguistics
Ouvrage du Chanoine Victorin RATEL publié en 1956 par l'Institut de linguistique romane avec le concours du CNRS. Description du vocabulaire patois d'une vallée de la Maurienne.
Exemplaire disponibleà la bibliothèque de l'Université de Provence, centre Schuman, cote 3682.
Domaine(s) linguistique(s) : lexicography, anthropological_linguistics
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Corpusécrit de propositions en WH- (interrogatives indirectes, relatives libres, exclamatives indirectes, circonstancielles) tirées de textes littéraires (corpus de thèse).
Domaine(s) linguistique(s) : syntax, text_and_corpus_linguistics
Corpusécrit de propositions en WH- (interrogatives indirectes, relatives libres, exclamatives indirectes, circonstancielles) tirées de textes littéraires (corpus de thèse).
Domaine(s) linguistique(s) : syntax, text_and_corpus_linguistics
[français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Ce corpus vidéo (5h environ) présente 10 sujets étudiants en master Français Langue Etrangère et Seconde (FLES) réalisant une tâche d'explication lexicale dans deux conditions : avec un sujet francophone natif et avec un sujet non natif apprenant le français (niveau B1-B2). La tâche est de faire devinerles mots tirés au sort en utilisant des stratégies verbales et non verbales librement. La seule restriction : pas de mot étrangers, pas de dessin et pas de mot de la même famille que le mot à faire deviner.
L'analyse de ces données permettra de comparer les stratégies verbales et non verbales des futurs enseignants de FLES en situation de contrôle (avec un natif) et en situation de simulation professionnelle (avec un non natif).
Ce corpus vidéo (5h environ) présente 10 sujets étudiants en master Français Langue Etrangère et Seconde (FLES) réalisant une tâche d'explication lexicale dans deux conditions : avec un sujet francophone natif et avec un sujet non natif apprenant le français (niveau B1-B2). La tâche est de faire devinerles mots tirés au sort en utilisant des stratégies verbales et non verbales librement. La seule restriction : pas de mot étrangers, pas de dessin et pas de mot de la même famille que le mot à faire deviner.
L'analyse de ces données permettra de comparer les stratégies verbales et non verbales des futurs enseignants de FLES en situation de contrôle (avec un natif) et en situation de simulation professionnelle (avec un non natif).
Bol Processor 2 (BP2) est un logiciel de composition/improvisation générant des structures d'objets sonores à partir d'un ensemble de règles similaires à celles des grammaires formelles. Le moteur d'inférence produit des chaînes de symboles auxquelles sont appliquées un algorithme d'expansion de structures polyphoniques/polyrythmiques (polymetriques), puis un algorithme de temporalisation utilisant des contraintes sur les objets sonores. Interfacé à l'origine avec MIDI et Csound, BP2 peut être utilisé pour modéliser les durées et les formes mélodiques en synthèse de la parole.
Lien sur SourceForge : http://bolprocessor.sourceforge.net
Domaine(s) linguistique(s) : mathematical_linguistics, writing_systems, speech_prosody
Lien sur SourceForge : http://bolprocessor.sourceforge.net
Domaine(s) linguistique(s) : mathematical_linguistics, writing_systems, speech_prosody
[anglais; anglais -> anglais britannique] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Annotations du corpus d'anglais britannique contemporain. Cette version contient un enrichissement au niveau de la segmentation phonèmes qui ont été corrigés manuellement.
Domaine(s) linguistique(s) : discourse_analysis, speech_prosody, phonology, phonetics
Annotations du corpus d'anglais britannique contemporain. Cette version contient un enrichissement au niveau de la segmentation phonèmes qui ont été corrigés manuellement.
Domaine(s) linguistique(s) : discourse_analysis, speech_prosody, phonology, phonetics
[marathi] Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)
Corpus de chants de la mouture par des femmes de caste Mahar au Maharashtra (Inde)à la mémoire de Bhimrao Ramji Ambedkar (1891-1956)
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, historical_linguistics
Corpus de chants de la mouture par des femmes de caste Mahar au Maharashtra (Inde)à la mémoire de Bhimrao Ramji Ambedkar (1891-1956)
Collection : Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi [ccrss-000749]
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics, historical_linguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Momel (Modelling melody) est un algorithme pour l'analyse et la synthèse de motifs d'intonation de la parole.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation, speech_prosody
Momel (Modelling melody) est un algorithme pour l'analyse et la synthèse de motifs d'intonation de la parole.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation, speech_prosody
[marathi; marathi -> marathi rural] Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)
Collection de chants populaires, poèmes et mythes enregistrés dans le Maharastra rural (Inde)
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics
Collection de chants populaires, poèmes et mythes enregistrés dans le Maharastra rural (Inde)
Domaine(s) linguistique(s) : sociolinguistics, anthropological_linguistics
[occitan (post 1500) -> provençal alpin ou nord-occitan; occitan (post 1500); français] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Série de projets sur les patois de Valjouffrey et vallées voisines qui ont pour objectif principal d'identifier des locuteurs natifs et des informateurs, ainsi que des matériaux de recherche non publiés sur la langue et son contexte culturel/historique.
Les locuteurs natifs et les experts participentà des séances d'enregistrement (voir crdo000764). Les enregistrements anciens sont numérisés, indexés et commentés par des experts. Les manuscrits inédits sont scannés pour une distribution non-commerciale et serviront de base à de futurs travaux d'édition critique en collaboration avec leurs auteurs.
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)
Série de projets sur les patois de Valjouffrey et vallées voisines qui ont pour objectif principal d'identifier des locuteurs natifs et des informateurs, ainsi que des matériaux de recherche non publiés sur la langue et son contexte culturel/historique.
Les locuteurs natifs et les experts participentà des séances d'enregistrement (voir crdo000764). Les enregistrements anciens sont numérisés, indexés et commentés par des experts. Les manuscrits inédits sont scannés pour une distribution non-commerciale et serviront de base à de futurs travaux d'édition critique en collaboration avec leurs auteurs.
Domaine(s) linguistique(s) : language_documentation, lexicography, sociolinguistics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Objet : extraire les objets contenus dans une collection PRAAT (texte ou binaire) sous la forme de fichiers dans le répertoire indiqué. Cette opération est nécessaire avant de déposer un projet PRAAT dans une archive institutionnelle comme le CRDO.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
Objet : extraire les objets contenus dans une collection PRAAT (texte ou binaire) sous la forme de fichiers dans le répertoire indiqué. Cette opération est nécessaire avant de déposer un projet PRAAT dans une archive institutionnelle comme le CRDO.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
[français] Institut de la communication parlée (ICP, Grenoble FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
La base de données EUROM1 contient des enregistrements de 60 locuteurs en 11 langues européennes : danois, néerlandais, anglais britannique, français, allemand, norvégien, suédois, néerlandais, grec, portugais, espagnol. Elle a été explicitement conçue pour faciliter les comparaisons phonétiques entre langues, en s'appuyant sur des matériaux similaires et des protocoles d'enregistrement identiques dans toutes les langues.
Le corpus accessible ici est celui d'EUROM1 en français utilisé dans le cadre du projet MULTEXT.
La version proposée ici a été reformatée pour assurer sa compatibilité avec la plateforme d'archivage pérenne.
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonology, syntax, speech_prosody, phonetics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
La base de données EUROM1 contient des enregistrements de 60 locuteurs en 11 langues européennes : danois, néerlandais, anglais britannique, français, allemand, norvégien, suédois, néerlandais, grec, portugais, espagnol. Elle a été explicitement conçue pour faciliter les comparaisons phonétiques entre langues, en s'appuyant sur des matériaux similaires et des protocoles d'enregistrement identiques dans toutes les langues.
Le corpus accessible ici est celui d'EUROM1 en français utilisé dans le cadre du projet MULTEXT.
La version proposée ici a été reformatée pour assurer sa compatibilité avec la plateforme d'archivage pérenne.
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonology, syntax, speech_prosody, phonetics
[anglais] UCL Speech Hearing and Phonetic Sciences (UCL SH&PS, London UK)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
La base de données EUROM1 contient des enregistrements de 60 locuteurs en 11 langues européennes : danois, néerlandais, anglais britannique, français, allemand, norvégien, suédois, néerlandais, grec, portugais, espagnol. Elle a été explicitement conçue pour faciliter les comparaisons phonétiques entre langues, en s'appuyant sur des matériaux similaires et des protocoles d'enregistrement identiques dans toutes les langues.
Le corpus accessible ici est celui d'EUROM1 en anglais utilisé dans le cadre du projet MULTEXT.
La version proposée ici a été reformatée pour assurer sa compatibilité avec la plateforme d'archivage pérenne.
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonology, syntax, speech_prosody, phonetics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
La base de données EUROM1 contient des enregistrements de 60 locuteurs en 11 langues européennes : danois, néerlandais, anglais britannique, français, allemand, norvégien, suédois, néerlandais, grec, portugais, espagnol. Elle a été explicitement conçue pour faciliter les comparaisons phonétiques entre langues, en s'appuyant sur des matériaux similaires et des protocoles d'enregistrement identiques dans toutes les langues.
Le corpus accessible ici est celui d'EUROM1 en anglais utilisé dans le cadre du projet MULTEXT.
La version proposée ici a été reformatée pour assurer sa compatibilité avec la plateforme d'archivage pérenne.
Collection : EUROM1 collection [eurom-000741]
Domaine(s) linguistique(s) : phonology, syntax, speech_prosody, phonetics
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Script PRAAT servantà corriger le codage d'anciens fichiers en vue de leur archivage. Les fichiers textes désignés par leurs extensions sont convertis au format de codage UTF8.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
Script PRAAT servantà corriger le codage d'anciens fichiers en vue de leur archivage. Les fichiers textes désignés par leurs extensions sont convertis au format de codage UTF8.
Collection : Outils LPL [lpl-000763]
Domaine(s) linguistique(s) : applied_linguistics, cognitive_science, language_documentation
[anglais] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Il s'agit d'un corpus d'anglais britannique contemporain extrait d'Aix-MARSEC (crdo000033). Il représente 47 minutes de parole continue. Cinq locuteurs différents lisent des extraits de nouvelles destinées aux enfants pour certains ou à un public adulte pour d'autres. Ces locuteurs sont des lecteurs professionnels ou des acteurs et l'ensemble du corpus est produit dans un style de parole expressif.
Domaine(s) linguistique(s) : speech_prosody, phonology, phonetics, discourse_analysis
Il s'agit d'un corpus d'anglais britannique contemporain extrait d'Aix-MARSEC (crdo000033). Il représente 47 minutes de parole continue. Cinq locuteurs différents lisent des extraits de nouvelles destinées aux enfants pour certains ou à un public adulte pour d'autres. Ces locuteurs sont des lecteurs professionnels ou des acteurs et l'ensemble du corpus est produit dans un style de parole expressif.
Domaine(s) linguistique(s) : speech_prosody, phonology, phonetics, discourse_analysis
[anglais; anglais -> anglais britannique; français; espagnol] Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Enrichissements du corpus trilingue français/anglais/espagnol
Collection : Collection de corpus trilingue français/anglais/espagnol [sldr000740]
Domaine(s) linguistique(s) : phonetics, phonology, applied_linguistics, language_documentation
Enrichissements du corpus trilingue français/anglais/espagnol
Collection : Collection de corpus trilingue français/anglais/espagnol [sldr000740]
Domaine(s) linguistique(s) : phonetics, phonology, applied_linguistics, language_documentation
