English SpeechDat(M) Polyphone database DB2

View resource name in all available languages

Base de données "Polyphone" en anglais (SpeechDat(M)) DB2

ID:

ELRA-S0012

The (polyphone-like) English SpeechDat(M) database contains the recordings of 1,000 speakers who were recorded over the fixed telephone network. It is divided into two sub-sets: the phonetically rich sentences (one CD) known as DB2, and the application-oriented utterances (two CDs) known as DB1.

It was validated by SPEX (the Netherlands) to assess its compliance with the SpeechDat format and content specifications.

Each speaker uttered the following items: number and letter sequences, common control keywords, dates, times, money amounts, etc.

This provides a realistic basis for using these resources for the training and assessment of speaker-independent recognition of both isolated and continuous speech utterances, employing either whole-word modeling and/or phoneme based approaches.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

Il s'agit de la base de données SpeechDat (M) anglaise enregistrée selon les règles des bases de données "polyphone". Elle contient des enregistrements de 1000 locuteurs, choisis selon les critères démographiques (âge, sexe, lieu, ...) et enregistrés à travers le réseau téléphonique.

La base de données est répartie en deux ensembles: les phrases phonétiquement riches et les mots de commandes, orientés vers des applications (il s'agit de chiffres, nombres, séquences de lettres, mots de commande usuels, etc.). Ce qui fourni une base solide pour la réalisation de systèmes de reconnaissance de la parole, indépendant du locuteur aussi bien en mode mots isolés qu'en mode parole continue, utilisant des modèles phonétiques ou des modèles de "mots".
La fréquence d'échantillonnage est de 8 KHz, un codage sur 8 bit, la loi a, donnant un débit de 64 kB/s.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.