Danish SpeechDat-Car - In-car recordings
View resource name in all available languages
Base de données SpeechDat-Car du danois - Enregistrements voiture seulement
ID:
ELRA-S0132_03
The Danish SpeechDat-Car contains the recordings of 300 Danish speakers from 5 different regions (162 males, 138 females), recorded over the GSM telephone network, and in a car. This database is partitioned into 15 DVDs (53 GB), plus 1 CD-ROM for e.g. non-signal files and documentation. The speech data files are in two formats. Four of the microphones were recorded on the computer in the boot of the car. The speech data are stored as sequences of 16 kHz, 16 bit and uncompressed. The fifth microphone was connected to the cell phone, and was recorded on a remote machine, with compressed data stored as sequences of 8 bit A-law 8.kHz. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.
This speech database was validated by SPEX (the Netherlands) to assess its compliance with the SpeechDat-Car format and content specifications.
Each speaker uttered the following items:
* 2 voice activation keywords
* 1 sequence of 10 isolated digits
* 7 connected digits (1 sheet number -5 digits, 1 spontaneous telephone number, 3 read telephone numbers, 1 credit card number –14/16 digits, 1 PIN code -6 digits)
* 3 dates (1 spontaneous date e.g. birthday, 1 prompted date, 1 relative or general date expression)
* 2 word spotting phrases using an embedded application word
* 4 isolated digits
* 7 spelled words (1 spontaneous e.g. own forename or surname, 1 directory city name, 4 real word/name, 1 artificial name for coverage)
* 1 money amount
* 1 natural number
* 7 directory assistance names (1 spontaneous e.g. own forename or surname, 1 city of birth/growing up, 2 most frequent cities, 2 most frequent company/agency, 1 "forename surname")
* 9 phonetically rich sentences
* 2 time phrases (1 spontaneous time of day, 1word style time phrase)
* 4 phonetically rich words
* 67 application words (13 mobile phone application words, 22 IVR function keywords, 32 car products keywords)
* 2 additional language dependent keywords
* Prompts for spontaneous speech
* 2 additional keywords from a list of 10
The following age distribution has been obtained: 84 speakers are between 18 and 30, 99 speakers are between 31 and 45, 98 speakers are between 46 and 60, and 19 speakers are over 60.
A pronunciation lexicon with a phonemic transcription in SAMPA is also included.
View resource description in all available languages
La base de données SpeechDat-Car du danois est composée d'enregistrements réalisés à travers le réseau GSM danois, et dans une voiture. 300 locuteurs danois (162 hommes, 138 femmes) de 5 régions différentes ont été enregistrés. Cette base de données est distribuée sur 15 DVD (53 GB), avec 1 CD-ROM qui contient les transcriptions, la documentation, etc. Les bases orales réalisées lors du projet SpeechDat-Car ont été validées par SPEX, Pays-Bas, afin de contrôler leur adéquation avec le format SpeechDat-Car et les spécifications de contenu. Les données de parole se présentent sous deux formats. Quatre microphones ont été connectés sur un ordinateur placé dans le coffre de la voiture. Ces fichiers sont stockés en séquences d'échantillons de 16 kHz, 16 bit et ne sont pas compressés. Le cinquième microphone a été connecté au téléphone mobile et les enregistrements effectués sur une machine à distance. Les fichiers sont ici stockés en séquences d'échantillons de 8kHz, 8 bit loi-A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.
Chaque locuteur a prononcé les éléments suivants :
* 2 mots-clés d'activation vocale
* 1 séquence de 10 chiffres isolés
* 7 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (5+ chiffres), 1 numéro de téléphone spontané, 3 numéros de téléphone lus, 1 numéro de carte de crédit (14-16 chiffres), 1 code confidentiel (6 chiffres)
* 3 dates : 1 date spontanée (ex. anniversaire), 1 date lue, 1 date générale
* 2 expressions utilisant un mot de commande
* 4 chiffres isolés
* 7 mots épelés : 1 spontané (nom ou prénom du locuteur), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 4 mots/noms réels, 1 nom artificiel pour couverture
* 1 montant en devises
* 1 nombre naturel
* 7 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (nom ou prénom du locuteur), 1 nom de ville de naissance/d'origine du locuteur (spontané), 2 noms de ville parmi les plus fréquentes, 2 noms de compagnie/société parmi les plus fréquentes, 1 répétition de "prénom nom"
* 9 phrases phonétiquement riches
* 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps
* 4 mots phonétiquement riches
* 67 mots de commande: 13 mots de commande dans le domaine de la téléphonie mobile, 22 mots de fonction dans le domaine des serveurs vocaux interactifs, 32 mots-clés de produits du domaine de l'automobile
* 2 mots clés dépendants de la langue supplémentaires
* phrases spontanées
* 2 mots clés supplémentaires choisis parmi une liste de 10
Les classes d'âge sont réparties comme suit : 84 locuteurs ont entre 18 et 30 ans, 99 locuteurs entre 31 et 45 ans, 98 locuteurs entre 46 et 60 ans et 19 locuteurs ont plus de 60 ans.
Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.
People who looked at this resource also viewed the following: