The "SIVA" Speech Database for Speaker Verification and Identification

View resource name in all available languages

SIVA, base de données orale pour la vérification et l'identification du locuteur

ID:

ELRA-S0028

The Italian speech database SIVA (?Speaker Identification and Verification Archives: SIVA?), is a database comprising more than two thousands calls, collected over the public switched telephone network, and available very soon via ELRA.
The SIVA database consists of four speaker categories: male users, female users, male impostors, female impostors. Speakers were contacted via mail before the test, and they were asked to read the information and the instructions provided carefully before making the call. About 500 speakers were recruited using a company specialized in selection of population samples. The others were volunteers contacted by the institute concerned.
Speakers access the recording system by calling a toll free number. An automatic answering system guides them through the three sessions that make up a recording. In the first session, a list of 28 words (including digits and some commands) is recorded using a standard enumerated prompt. The second session is a simple unidirectional dialogue (the caller answers prompted questions) where personal information is asked (name, age, etc.). In the third session, the speaker is asked to read a continuous passage of phonetically balanced text that resembles a short curriculum vitae.
The signal is a standard 8kHz sampled signal, coded using 8 bits mu-law format. The data collected so far consists of:
· MU: male users 18 speakers, 20 repetitions
· FU: female users 16 speakers, 26 repetitions
· MI: male impostors: 189 speakers, 2 repetitions, and 128 speakers, 1 repetition
· FI: female impostors: 213 speakers, 2 repetitions, and 107 speakers, 1 repetition.

View resource description in all available languages

La base de données orales de l'italien SIVA (Identification du locuteur et archives de vérifications - Speaker Identification and Verification Archives), contient plus de 2 000 enregistrements téléphoniques.

SIVA est composée de quatre catégories de locuteurs : "utilisateurs" hommes, "utilisateurs" femmes, "imposteurs" hommes, "imposteurs" femmes. Les locuteurs ont d'abord été contactés par courrier avant le test, puis on leur a demandé de lire les informations et les instructions soigneusement fournies avant d'effectuer l'appel. Environ 500 locuteurs ont été recrutés par une société spécialisée dans la sélection d'échantillons de population. Les autres sont des volontaires contactés par l'institut concerné.

Les locuteurs ont accédé au système d'enregistrement en appelant un numéro vert. Un système de réponse automatique les guide à travers les trois sessions qui constituent un enregistrement. La première session qui contient une liste de 28 mots (y compris des chiffres et quelques mots de commande) a été enregistrée en utilisant un énoncé numéroté standard. La deuxième session consiste en un simple dialogue unidirectionnel (le locuteur répond à des questions énoncées) où l'on demande des informations personnelles (nom, âge, etc.). Dans la troisième session, le locuteur doit lire un passage continu d'un texte phonétiquement équilibré similaire à un bref curriculum vitae.

La fréquence d'échantillonnage est de 8kHz, le codage utilise 8 bits selon la loi µ.
Les données collectées sont constituées comme suit :

* 18 répétitions par 20 locuteurs hommes,
* 18 répétitions par 20 locuteurs femmes,
* 1 répétition par 400 "imposteurs" hommes,
* 1 répétition par 400 "imposteurs" femmes

You don’t have the permission to edit this resource.