German SpeechDat(II) FDB-4000

View resource name in all available languages

Base de données SpeechDat(II) FDB 4000 de l'allemand

ID:

ELRA-S0063

The German SpeechDat(II) FDB 4000 consists of 4000 calls over the German fixed network, stored on 17 CD-ROMs in the final SpeechDat(II) database exchange format. The speech databases made within the SpeechDat(II) project were validated by SPEX, the Netherlands, to assess their compliance with the SpeechDat format and content specifications.

The following items were recorded:
- 1 isolated digit
- 1 sequence of 10 isolated digits
- prompt sheet number = 5
- 9-11 digit telephone number (read)
- 15-16 digit credit card number (read, 150 different credit card numbers were found)
- 6 digit PIN code (read)
- 1 natural number (read)
- 1 money amount (read)
- 2 yes/no questions (spontaneous, not prompted)
- 3 dates (1 spontaneous, e.g. birthday; 1 prompted text form; 1 relative and general date form)
- 1 time of day (spontaneous)
- 1 time phrase (read)
- 3 application words
- 1 word spotting phrase
- 5 directory assistance names (1 spontaneous name (e.g. forename), 1 spontaneous city name, 1 read city name (from a list of 500 most frequent), 1 read company/agency name (from a list of 500 most frequent), 1 read proper name, fore- and surname (from list of 150 SDB names).
- 3 spellings (1 spontaneous, e.g. forename; 1 directory city name; 1 real/artificial word)
- 4 isolated words
- 9 phonetically rich sentences (read)

The speech files are stored as sequence of 8-bit, 8kHz A-law speech files and are not compressed. Each prompt utterance is stored within a separate file and has an accompanying ASCII SAM label file.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat(II) FDB-4000 de l'allemand est composée de 4000 appels (1938 hommes, 2060 femmes, et 2 locuteurs de genre non identifié) enregistrés à travers le réseau téléphonique fixe allemand et présentés sur 17 CD-ROM. Les bases de données SpeechDat(II) ont été réalisées selon les spécifications du projet SpeechDat(II) et validées par SPEX, Pays-Bas.

Les fichiers de parole sont stockés en séquences d'échantillons de 8 bits, 8 kHz, loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Les éléments suivants ont été enregistrés :

* 1 chiffre isolé ;
* 1 séquence de 10 chiffres isolés ;
* 1 nombre de plus de 5 chiffres permettant d'identifier la feuille de prompt ;
* 1 numéro de téléphone d'environ 9-11 chiffres (lu) ;
* 1 numéro de carte de crédit de 15-16 chiffres (lu, 150 numéros différents ont été trouvés) ;
* 1 code confidentiel de 6 chiffres (lu) ;
* 1 nombre entier naturel (lu) ;
* 1 montant en devises (lu) ;
* 2 questions oui/non (spontanées) ;
* 3 dates (1 spontanée, par ex : anniversaire ; 1 date lue ; 1 date relative et générale lue) ;
* 1 jour (spontané) ;
* 1 phrase comportant une notion de temps (lue) ;
* 3 mots de commande ;
* 1 expression utilisant un mot de commande ;
* 5 noms provenant d'un annuaire de renseignements téléphoniques (1 nom spontané (ex : prénom), 1 nom de ville spontané, 1 nom de ville lu (provenant d'une liste de 500 noms les plus fréquents), 1 nom de compagnie lu (à partir d'une liste de 500 noms les plus fréquents), 1 nom propre, prénom et nom de famille, lu (à partir d'une liste de 150 noms) ;
* 3 mots épelés (1 épellation spontanée, par ex: prénom; 1 nom de ville; 1 mot réel/artificiel) ;
* 4 mots isolés ;
* 9 phrases phonétiquement riches (lues).

Les classes d'âge sont réparties comme suit : 204 locuteurs de moins de 16 ans, 1685 locuteurs entre 16 et 30 ans, 1166 locuteurs entre 31 et 45 ans, 729 locuteurs entre 46 et 60 ans et 216 locuteurs de plus de 60 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.