Italian Speech Corpus 1 (Appen)

View resource name in all available languages

Corpus de parole italien 1 (Appen)

ID:

ELRA-S0147

The Italian Speech Corpus 1 contains the recordings of 202 native Italian speakers (112 males, 90 females) recorded in an office and a closed public place, over 4 channels, in a range of low to medium background noise environments (Plantronics Audio 10 (computer/desk mic), Shure SM58 (desk mounted dynamic mic), Shure Beta 53 (headset mic) and Andrea DA-400 (array mic)). The data collection and transcription were performed by Appen (Australia).
Speech samples are stored as sequences of 16-bit 22.05 kHz PCM in uncompressed WAV files.
Each speaker read the following items (prompted):
- 100 command words
- 100 phonetically rich sentences
The following age distribution has been obtained: 22 speakers are between 18 and 19, 141 are between 20 and 30, 34 are between 31 and 45, and 5 are between 45 and 60.
Information about the speakers? place of birth is included.
The database is provided with orthographic transcriptions in SAMPA, including canonical and alternative pronunciation, and syllable, stress and acoustic events markings. All transcriptions were segmented at the utterance (sentence/command word) level, annotated at the word level and checked manually. A pronunciation lexicon including 7,300 headwords (plus variants) is also available.
This database is aimed to be used within speech recognition and voice control applications.

View resource description in all available languages

Le corpus de parole italien 1 comprend 202 locuteurs de langue maternelle italienne (112 hommes, 90 femmes) enregistrés dans deux environnements (bureau et lieu public fermé), à travers 4 canaux, dans des conditions de bruit de fond de niveau faible ou moyen (Plantronics Audio 10 (microp pour PC/de table), Shure SM58 (microphone dynamique de table), Shure Beta 53 (micro-casque) et Andrea DA-400 (microphone « array »)). La collecte et la transcription des données ont été réalisées par Appen (Australie).

Les fichiers WAV sont stockés en séquences d'échantillons de 22,05 kHz, 16 bit, PCM et ne sont pas compressés.

Chaque locuteur a lu les éléments suivants (énoncés):

* 100 mots de commande
* 100 phrases phonétiquement riches

Les classes d'âge sont réparties comme suit : 22 locuteurs ont entre 18 et 19 ans, 141 entre 20 et 30, 34 entre 31 et 45, et 5 entre 45 et 60. Des informations sur le lieu de naissance des locuteurs sont incluses.

La base de données est fournie avec les transcriptions phonétiques en SAMPA, dont la transcription canonique et prononciations alternatives, ainsi que les marqueurs de syllabe, d’accentuation et d’événements acoustiques. Toutes les transcriptions sont segmentées au niveau de l’occurrence (phrase/mot de commande), annotées au niveau du mot et vérifiées manuellement. Un lexique de prononciation composé de 7 300 mots (plus variantes) est également disponible.

La base de données a pour but d'être utilisée dans des applications de reconnaissance vocale et de vérification du locuteur.

You don’t have the permission to edit this resource.