APASCI
ID:
ELRA-S0039
APASCI is an Italian speech database recorded in an insulated room with a Sennheiser MKH 416 T microphone. It includes 5,290 phonetically rich sentences and 10,800 isolated digits, for a total of 58,924 word occurrences (2,191 different words) and 641 minutes of speech.
The speech material was read by 100 Italian speakers (50 male and 50 female). Each of them uttered 1 calibration sentence, 4 sentences with a wide phonetic coverage, 15 or 20 sentences with a wide diphonic coverage. Six of these speakers (3 male and 3 female) read 26 occurrences of the calibration sentence, 104 sentences with a wide phonetic coverage, 390 sentences with a wide diphonic coverage. 54 of the speakers (42 male and 12 female) pronounced 20 repetitions of the 10 isolated digits.
The documentation of the database includes the transcription of each sentence both at phonemic and at orthographic levels.
This database allows to design, train and evaluate continuous speech recognition systems (speaker independent, speaker adaptive, speaker dependent, multispeakers). It was also designed for research on acoustic modelling as well as on acoustic parameters for speech recognition and for research on speaker recognition.
Format: 16 bit linear
Standard: NIST SPHERE
Sampling rate: 16 kHz
Medium: CD-ROM
View resource description in all available languages
APASCI est une base de données acoustique en italien enregistrée en chambre isolée avec un microphone Sennheiser MKH 416 T. Elle comprend env. 5 290 phrases phonétiquement riches et 10 800 chiffres isolés, pour un total de 58 924 occurrences de mots (2 191 mots différents) et 641 minutes de parole.
La base de données est enregistrée par 100 locuteurs italiens (50 hommes et 50 femmes). Chacun d'entre eux a prononcé 1 phrase de calibrage, 4 phrases à large couverture phonétique, 15 ou 20 phrases à large couverture diphonique.
Six locuteurs (3 hommes et 3 femmes) ont prononcé 26 occurrences de la phrase de calibrage, 104 phrases à large couverture phonétique, 390 phrases à large couverture diphonique.
54 locuteurs (42 hommes et 12 femmes) ont répété 20 fois les 10 chiffres isolés.
Les annotations linguistiques de la base sont réalisées aux niveaux phonémique et orthographique.
APASCI a pour but de permettre l'apprentissage, le test et l'évaluation des systèmes de reconnaissance de parole continue (indépendant du locuteur, avec adaptation au locuteur, dépendant du locuteur, multi-locuteur). Elle est également conçue pour la recherche sur les modèles acoustiques et linguistiques, ainsi que pour la recherche de nouveaux paramètres acoustiques pour la reconnaissance de la parole et du locuteur.
Format : 16 bit linéaire
Standard : NIST SPHERE
Taux d'échantillonnage : 16 kHz
Support : CD-ROM
People who looked at this resource also viewed the following: