Projet « Valjouffrey » —> Annotations
Annotations du corpus Valjouffrey
Le TextGrid comprendra en premier les couches (tier) suivantes :
- phrase
- langue
- diffusion
- locuteur
1) La couche "phrase" marquera les frontières des unités de souffle et l'annotation correspondante sera simplement la traduction de la phrase.
S'inspirer des conventions du GARS pour cette couche.
Lorsque le problème de la graphie aura été réglé nous créerons une couche "mot" pour faire une transcription précise.
2) La couche "langue" indiquera en quelle langue est le passage :
- mul = multilingue, quand il y a un mélange flagrant
- oci-1 = provençal (pour Médéric !)
- oci-2 = patois de Valjouffrey
- fra = français
Dans le futur nous créerons d'autres codes pour désigner d'autres patois.
3) La couche "diffusion" indiquera quels destinataires peuvent écouter le passage. Voici les étiquettes proposées :
- public = diffusé sans restriction (après autorisation)
- archive = ne peut pas être diffusé mais peut circuler entre chercheurs
- couper = ne doit même pas être archivé : bruit, hors sujet, confidentiel...
4) La couche "locuteur" donnera les initiales du/des locuteurs, en utilisant les initiales conventionnelles du projet. Dans le cas de superpositions, les initiales seront séparées par des virgules.

http://crdo.fr/sldr000764