IDIOLOGOS 2 “Eingenspeakers” (NEOLOGOS Project)

View resource name in all available languages

IDIOLOGOS 2 “Eingenspeakers” (projet NEOLOGOS)

ID:

ELRA-S0226_02

The IDIOLOGOS 2 “Eingenspeakers” database was produced within the French national project NEOLOGOS, as part of the Technolangue programme funded by the French Ministry of Research and New Technologies (MRNT). The databases produced in the framework of the NEOLOGOS project are designed for the development and the assessment of French speech or speaker recognizers and speech synthesizers. They consist in:
1) the IDIOLOGOS databases are made of adults voices and are available in 2 subsets:
- the “Bootstrap” database (catalogue ref. ELRA-S0226-01),
- the “Eingenspeakers” database (catalogue ref. ELRA-S0226-02)
2) the PAIDIALOGOS database (catalogue ref. ELRA-S0227) is made of children’s and teenagers’ voices.

The IDIOLOGOS 2 “Eingenspeakers” database contains the recordings of 200 adult French speakers (97 males and 103 females) recorded over the French fixed telephone network. The speakers uttered 45 sentences per call with 10 calls per speaker. The 450 sentences per speaker are common to all speakers. Speakers were selected from the IDIOLOGOS 1 “Bootstrap” (ELRA-S0226-01) database.

This database is distributed as 1 DVD-ROM. The speech files are stored as sequences of 8-bit, 8kHz A-law speech files and are not compressed, according to the specifications of NEOLOGOS. Each prompt utterance is stored within a separate file and has an accompanying ASCII SAM label file.

This speech database was validated by SPEX (the Netherlands) to assess its compliance with the NEOLOGOS format and content specifications.

Each speaker uttered the following items:
- 1 digit sequence (6 digits)
- 1 telephone number (10 digits)
- 1 credit card number (16 digits)
- 1 spelling of directory assistance city name
- 1 real/artificial for coverage
- 45 phonetically rich sentences

The following age distribution has been obtained: 42 speakers are between 18 and 30, 50 speakers are between 31 and 45, 62 speakers are between 46 and 61, and 46 speakers are over 61.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données IDIOLOGOS 2 “Eingenspeakers” a été produite dans le cadre du projet national français NEOLOGOS, du programme Technolangue, financé par le ministère français chargé de la recherche et des nouvelles technologies (MRNT). Les bases de données produites dans le cadre du projet NEOLOGOS ont été conçues pour le développement et la vérification de systèmes de reconnaissance de la parole ou du locuteur en français, ainsi que pour les synthétiseurs de parole. Elle consistent en :
1) les bases IDIOLOGOS sont composées de voix adultes et sont disponibles sous la forme de 2 sous-ensembles :
- la base de données “Bootstrap” (réf. catalogue ELRA-S0226-01),
- la base de données “Eingenspeakers” (réf. catalogue ELRA-S0226-02) ;
2) la base de données PAIDIALOGOS (réf. catalogue ELRA-S0227) est composée de voix d’enfants et d’adolescents.

La base de données IDIOLOGOS 2 “Eingenspeakers” contient les enregistrements de 200 locuteurs français adultes (97 hommes, 103 femmes) enregistrés à travers le réseau téléphonique fixe français. Les locuteurs ont prononcé 45 phrases phonétiquement riches, avec 10 appels par locuteur. Les 450 phrases prononcées par locuteur sont identiques pour tous les locuteurs. Les locuteurs ont été sélectionnés à partir de la base IDIOLOGOS 1 “Bootstrap” (ELRA-S0226-01).

Cette base est distribuée sur 1 DVD-ROM. Selon les spécifications de NEOLOGOS, les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A et ne sont pas compressés. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Cette base de données a été validée par SPEX (Pays-Bas) afin de vérifier sa conformité avec le format NEOLOGOS et les spécifications du contenu.

Contenu du corpus :
• 1 séquence de chiffres (6 chiffres) ;
• 1 numéro de téléphone (10 chiffres) ;
• 1 numéro de carte de crédit (16 chiffres) ;
• 1 prénom, 1 nom de ville provenant d'un annuaire de renseignements téléphoniques ;
• 1 mot réel/artificiel pour la couverture ;
• 45 phrases phonétiquement riches ;

Les classes d'âge sont réparties comme suit : 42 locuteurs ont entre 18 et 30 ans, 50 locuteurs ont entre 31 et 45 ans, 62 locuteurs ont entre 46 et 61 ans et 46 locuteurs ont plus de 61 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.