RVG1 (Regional Variants of German 1, Part 1)

View resource name in all available languages

RVG1 (Variantes régionales de l'allemand 1)

ID:

ELRA-S0058

The corpus consists of single digits, connected digits, phone numbers, phonetically balanced sentences, computer command phrases and spontaneous speech. Each speaker has read a subcorpus of 85 items:

* 11 single digits (0-9, with the two pronunciations of 2 (`zwei', `zwo')),
* 19 connected digits (10-19, 20-100 in steps of ten),
* 12 computer command phrases,
* 30 phonetically balanced sentences,
* 5 6-digit phone numbers,
* 5 7-digit phone numbers,
* 2 phone numbers with area code,
* 1 minute spontaneous speech (monologue).

The speaker was placed in front of a standard IBM-compatible PC. The backround noise was limited to the usual noise in office environment, eg. door slam, backround crosstalk, phone ringing, paper rustle, PC noise, etc. The head of the speaker is in a range between 2-4 feet to the screen, 1-2 feet from the desktop microphones. The speaker is not forced into a special position. The speaker is wearing a Sennheiser HD 410 and is free to use the keyboard or the mouse in front of him. The three desktop microphones are: Sennheiser MD 441 U, Telex (Soundblaster) and Talk Back (AT&T). Speakers were selected to achieve the demoscopic density of the German spoken areas in Europe (including Austria and Switzerland).

The recorded sound samples are stored in NIST SPHERE format. The resolution is 16 Bits. The sampling frequency is 22.050 Hz except for speakers 001 to 036 which were recorded with 11.025 Hz. Each microphone channel is stored into a separate file. A transliteration of spontaneous speech according to Verbmobil Format is also provided.

RVG1, Part 1 contains 197 speakers recorded through 2 microphones.

(RVG1, Part 2, with 303 speakers recorded through 2 microphones will be available from the beginning of 1999.)

View resource description in all available languages

Le corpus comprend des chiffres isolés, des chiffres connectés, des numéros de téléphone, des phrases phonétiquement équilibrées, des phrases de commandes d'ordinateur et de la parole spontanée. Chacun des 498 locuteurs a lu un sous-corpus de 85 éléments:

* 11 chiffres isolés (0-9, avec les deux prononciations du 2 (" zwei ", " zwo ")),
* 19 chiffres connectés (10-19, 20-100 par groupes de dix),
* 12 phrases de commandes d'ordinateur,
* 30 phrases phonétiquement équilibrées,
* 5 numéros de téléphone à 6 chiffres,
* 5 numéros de téléphone à 7 chiffres,
* 2 numéros de téléphone avec le code régional,
* 1 minute de parole spontanée (monologue).

Chaque locuteur était placé en face d'un PC standard. Le bruit de fond était limité au bruit habituel d'un environnement de bureau, par exemple, un claquement de porte, une conversation, une sonnerie de téléphone, un froissement de papier, le bruit du PC, etc. La tête de chaque locuteur se trouve à une distance de 60 à 120 cm de l'écran et de 30 à 60 cm des micros de table. Le locuteur n'est pas obligé de s'installer dans une position particulière. Le locuteur porte un Sennheiser HD 410 et est libre d'utiliser le clavier ou la souris posés en face de lui. Les trois micros de table sont les suivants : un Sennheiser MD 441 U, un Telex (Soundblaster) et un Talk Back (AT&T). Les locuteurs ont été sélectionnés pour couvrir la densité démographique des régions germanophones d'Europe (y compris l'Autriche et la Suisse).

Les échantillons de sons enregistrés sont stockés sous le format NIST SPHERE. La résolution est de 16 Bits. La fréquence d'échantillonnage est de 22 050 Hz sauf pour les locuteurs 001 à 036 qui ont été enregistrés à 11 025 Hz. Chaque canal de micro est stocké dans un fichier séparé. Une transcription de la parole spontanée d'après le format Verbmobil est également fournie. RVG1, Partie 1 comprend 498 locuteurs enregistrés à travers des microphones basse qualité. RVG1, Partie 2 comprend 421 locuteurs enregistrés à travers des microphones haute qualité.

You don’t have the permission to edit this resource.