AURORA-5

ID:

ELRA-AURORA-CD0005

The Aurora project was originally set up to establish a worldwide standard for the feature extraction software which forms the core of the front-end of a DSR (Distributed Speech Recognition) system.

The AURORA-5 database has been mainly developed to investigate the influence on the performance of automatic speech recognition for a hands-free speech input in noisy room environments. Furthermore two test conditions are included to study the influence of transmitting the speech in a mobile communication system.

The earlier three Aurora experiments had a focus on additive noise and the influence of some telephone frequency characteristics. Aurora-5 tries to cover all effects as they occur in realistic application scenarios. The focus was put on two scenarios. The first one is the hands-free speech input in the noisy car environment with the intention of controlling either devices in the car itself or retrieving information from a remote speech server over the telephone. The second one covers the hands-free speech input in a type of office or in a type of living room to control e.g. a telephone device or some audio/video equipment.

The AURORA-5 database contains the following data:
• Artificially distorted versions of the recordings from adult speakers in the TI-Digits speech database downsampled at a sampling frequency of 8000 Hz. The distortions consist of:
- additive background noise,
- the simulation of a hands-free speech input in rooms,
- the simulation of transmitting speech over cellular telephone networks.
• A subset of recordings from the meeting recorder project at the International Computer Science Institute. The recordings contain sequences of digits uttered by different speakers in hands-free mode in a meeting room.
• A set of scripts for running recognition experiments on the above mentioned speech data. The experiments are based on the usage of the freely available software package HTK where HTK is not part of this resource.

Further information is also available at the following address: http://aurora.hsnr.de

View resource description in all available languages

Le projet Aurora a été créé à l’origine pour établir un standard international pour les logiciels d’extraction de caractéristiques qui forment le noyau du « front-end » d’un système DSR (Distributed Speech Recognition – Reconnaissance de la parole distribuée).

La base de données AURORA-5 a été développée dans le but principal d’étudier l’influence sur la performance de la reconnaissance automatique de la parole pour des entrées de parole en mode mains-libres dans des environnements bruités. De plus, deux conditions de test ont été incluses pour étudier l’influence de la transmission de parole dans un système de communication mobile.

Les trois expériences Aurora précédentes avaient comme point focal les bruits ajoutés et l’influence de certaines caractéristiques de fréquences téléphoniques. Aurora-5 tente de couvrir tous les effets tels qu’ils apparaissent dans des scénarios d’applications réalistes. La tâche est concentrée sur deux scénarios. Le premier concerne les entrées de parole en mode mains-libres dans un environnement de voiture en milieu bruité, avec comme intention de contrôler tout élément de la voiture ou de récupérer l’information à partir d’un serveur vocal à distance via le téléphone. Le deuxième scénario couvre les entrées de parole en mode mains-libres dans une sorte de bureau ou de salle à manger, afin de contrôler, par exemple, un outil téléphonique ou un équipement audio/vidéo..

La base de données AURORA-5 est constituée des données suivantes :
• Des versions artificiellement déformées des enregistrements des locuteurs adultes de la base de données orale TI-Digits, échantillonnées à une fréquence de 8000 Hz. Les déformations consistent en :
- du bruit de fond ajouté,
- la simulation d’entrées de parole en mode mains-libres dans une pièce fermée,
- la simulation d’une transmission vocale à travers les réseaux téléphoniques cellulaires.
• Un sous-ensemble des enregistrements du projet d’enregistrements de réunions du International Computer Science Institute. Les enregistrements contiennent des séquences de chiffres prononcés par les différents locuteurs dans une salle de réunion en mode mains-libres.
• Un ensemble de scripts pour les tests de reconnaissance en cours sur les données vocales mentionnées ci-dessus. Les tests sont basés sur l’usage du package logiciel HTK, libre d’accès. HTK n’est pas contenu dans cette ressource.

Des informations complémentaires sont également disponibles à cette adresse: http://aurora.hsnr.de

You don’t have the permission to edit this resource.