PAIDIALOGOS (NEOLOGOS Project)

View resource name in all available languages

PAIDIALOGOS (projet NEOLOGOS)

ID:

ELRA-S0227

The PAIDIALOGOS database was produced within the French national project NEOLOGOS, as part of the Technolangue programme funded by the French Ministry of Research and New Technologies (MRNT). The databases produced in the framework of the NEOLOGOS project are designed for the development and the assessment of French speech or speaker recognizers and speech synthesizers. They consist in:
1) the IDIOLOGOS databases are made of adults voices and are available in 2 subsets:
- the “Bootstrap” database (catalogue ref. ELRA-S0226-01),
- the “Eingenspeakers” database (catalogue ref. ELRA-S0226-02);
2) the PAIDIALOGOS database (catalogue ref. ELRA-S0227) is made of children’s and teenagers’ voices.

The PAIDIALOGOS database contains 37,364 utterances from 1010 child French speakers (510 males and 500 females) recorded over the French fixed telephone network.

This database is distributed as 1 DVD-ROM. The speech files are stored as sequences of 8-bit, 8kHz A-law speech files and are not compressed, according to the specifications of NEOLOGOS. Each prompt utterance is stored within a separate file and has an accompanying ASCII SAM label file.

This speech database was validated by SPEX (the Netherlands) to assess its compliance with the NEOLOGOS format and content specifications.

Each speaker uttered the following items:
- 3 application words (set of 42)
- 4 connected digits: 2 sequence of 3 isolated digits, 1 sheet number (7 digits), 1 telephone number (10 digits)
- 3 dates (1 spontaneous date e.g. birthday, 1 word style prompted date, 1 relative and general date expression)
- 2 isolated digits
- 3 spelled words (1 surname, 1 directory assistance city name, 1 real/artificial name for coverage)
- 1 currency money amount
- 1 natural number
- 4 directory assistance names (1 spontaneous, e.g. own surname, 1 city of where the call is made from, 1 most frequent French city out of a set of 40, 1 “forename surname”)
- 2 yes/no questions (1 predominantly “yes” question, 1 predominantly “no” question)
- 6 phonetically rich sentences
- 2 time phrases (1 time of call, 1 word style time phrase)
- 2 phonetically rich words

The following age distribution has been obtained: 6 speakers are under 7, 541 speakers are between 7 and 11, 308 speakers are between 12 and 14, 154 speakers are between 15 and 16, and 1 speaker is over 16.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données PAIDIALOGOS a été produite dans le cadre du projet national français NEOLOGOS, du programme Technolangue, financé par le ministère français chargé de la recherche et des nouvelles technologies (MRNT). Les bases de données produites dans le cadre du projet NEOLOGOS ont été conçues pour le développement et la vérification de systèmes de reconnaissance de la parole ou du locuteur en français, ainsi que pour les synthétiseurs de parole. Elles consistent en :
1) les bases IDIOLOGOS sont composées de voix adultes et sont disponibles sous la forme de 2 sous-ensembles :
- la base de données “Bootstrap” (réf. catalogue ELRA-S0226-01),
- la base de données “Eingenspeakers” (réf. catalogue ELRA-S0226-02) ;
2) la base de données PAIDIALOGOS (réf. catalogue ELRA-S0227) est composée de voix d’enfants et d’adolescents.

La base de données PAIDIALOGOS contient 37 364 occurrences de 1010 locuteurs français enfants (510 hommes, 500 femmes) enregistrés à travers le réseau téléphonique fixe français.

Cette base est distribuée sur 1 DVD-ROM. Selon les spécifications de NEOLOGOS, les fichiers de parole sont stockés en séquences d'échantillons de 8 bit, 8 kHz, loi-A et ne sont pas compressés. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Cette base de données a été validée par SPEX (Pays-Bas) afin de vérifier sa conformité avec le format NEOLOGOS et les spécifications du contenu.

Contenu du corpus :
• 3 mots de commande (à partir d’un ensemble de 42);
• 4 chiffres connectés : 2 séquences de 3 chiffres isolés, 1 numéro permettant d'identifier la feuille de prompt (7 chiffres), 1 numéro de téléphone (10 chiffres) ;
• 3 dates : 1 date spontanée (ex. anniversaire), 1 date lue, 1 date générale ;
• 2 chiffres isolés ;
• 3 mots épelés : 1 prénom, 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 1 mot réel/artificiel pour couverture ;
• 1 montant en devises ;
• 1 devise (mot optionnel) ;
• 1 nombre entier naturel ;
• 4 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (par ex. nom de famille), 1 ville où l’enregistrement a été réalisé, 1 nom de ville française parmi les plus fréquentes (sur 40), 1 répétition de "prénom nom" ;
• 2 questions oui/non : 1 question à prédominance "oui", 1 question à prédominance "non" ;
• 6 phrases phonétiquement riches ;
• 2 phrases comportant une notion de temps : 1 heure de l’appel (spontané), 1 phrase comportant une notion de temps ;
• 2 mots phonétiquement riches.

Les classes d'âge sont réparties comme suit : 6 locuteurs ont moins de 7 ans, 541 locuteurs ont entre 7 et 11 ans, 308 locuteurs ont entre 12 et 14 ans, 154 locuteurs ont entre 15 et 16 ans et 1 locuteur a plus de 16 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.