German SpeechDat-Car

View resource name in all available languages

Base de données SpeechDat-Car de l'allemand

ID:

ELRA-S0122

The German SpeechDat-Car database comprises 338 German speakers recorded over the mobile telephone network. This database is partitioned into 17 DVDs and 1 CD. The speech databases made within the SpeechDat-Car project were validated by SPEX, the Netherlands, to assess their compliance with the SpeechDat-Car format and content specifications.

The speech data files are in two formats. The signal data format for the in-car mobile platform recordings is 16 kHz, 16 bit, uncompressed unsigned integers in Intel format (lo-hi byte order); the channels are multiplexed in a single file, with the channel sequence being 0-1-2-3. The format of the fixed platform audio files is 8 kHz, 8 bit alaw encoding. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.

Each speaker uttered the following items:
- 2 voice activation keywords
- 1 sequence of 10 isolated digits
- 7 connected digits : 1 sheet number (4+ digits), 1 spontaneous telephone number (9-11 digits), 3 read telephone numbers, 1 credit card number (16 digits), 1 PIN code (6 digits)
- 3 dates : 1 spontaneous date (e.g. birthday), 1 prompted date, 1 relative or general date expression
- 2 word spotting phrases using an application word (embedded)
- German data phrases
- 4 isolated digits
- 7 spelled words : 1 spontaneous (own forename or surname), 1 spelling of directory city name, 4 real word/name, 1 artificial name for coverage
- 1 money amount
- 1 natural number
- 7 directory assistance names : 1 spontaneous (own forename or surname), 1 city of birth / growing up (spontaneous), 2 most frequent cities, 2 most frequent company/agency, 1 "forename surname"
- 9 phonetically rich sentences
- 2 time phrases : 1 time of day (spontaneous), 1 time phrase (word style)
- 4 phonetically rich words
- 69 application words: 13 mobile phone application words, 22 IVR function keywords, 32 car products keywords, 2 additional common application words
- 2 additional language dependent keywords
- spontaneous sentences

The following age distribution has been obtained: 187 speakers are between 16 and 30, 72 speakers are between 31 and 45, 70 speakers are between 46 and 60, and 9 speakers are over 60.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat-Car de l'allemand est composée de 338 enregistrements réalisés à travers le réseau téléphonique mobile. La base de données est répartie en 17 DVDs et 1 CD. Les bases orales réalisées lors du projet SpeechDat-Car ont été validées par SPEX, Pays-Bas, afin de contrôler leur adéquation avec le format SpeechDat-Car et les spécifications de contenu.

Les fichiers de données sont présentés dans deux formats : le format du signal, pour les enregistrements réalisés sur la plateforme mobile installée dans la voiture, est de 16 kHz, 16 bits; les canaux sont multiplexés dans un fichier unique, avec une séquence de 0-1-2-3. Le format des fichiers audio de la plateforme fixe est de 8 kHz, codage sur 8 bits loi A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Les éléments suivants ont été enregistrés :

- 2 mots-clés d'activation vocale
- 1 séquence de 10 chiffres isolés
- 7 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (4+ chiffres), 1 numéro de téléphone spontané, 3 numéros de téléphone lus, 1 numéro de carte de crédit (16 chiffres), 1 code confidentiel (6 chiffres)
- 3 dates : 1 date spontanée (ex. anniversaire), 1 date lue, 1 date générale
- 2 expressions utilisant un mot de commande
- expressions allemandes
- 4 chiffres isolés
- 7 mots épelés : 1 spontané (nom ou prénom du locuteur), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 4 mots/noms réels, 1 nom artificiel pour couverture
- 1 montant en devises
- 1 nombre naturel
- 7 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (nom ou prénom du locuteur), 1 nom de ville de naissance/d'origine du locuteur (spontané), 2 noms de ville parmi les plus fréquentes, 2 noms de compagnie/société parmi les plus fréquentes, 1 répétition de "prénom nom"
- 9 phrases phonétiquement riches
- 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps
- 4 mots phonétiquement riches
- 69 mots de commande: 13 mots de commande dans le domaine de la téléphonie mobile, 22 mots de fonction dans le domaine des serveurs vocaux interactifs, 32 mots-clés de produits du domaine de l'automobile et 2 mots de commande courants supplémentaires
- 2 mots-clés dépendants de la langue supplémentaires
- phrases spontanées

Les classes d'âge sont réparties comme suit : 187 locuteurs ont entre 16 et 30 ans, 72 locuteurs ont entre 31 et 45 ans, 70 locuteurs ont entre 46 et 60 ans, et 9 locuteurs ont plus de 60 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.