BABEL Romanian database – META-SHARE

Last view: 2026-01-04

174 Last view: 2026-01-04

BABEL Romanian database

View resource name in all available languages

Base de données BABEL du roumain

http://catalog.elra.info/product_info.php?products_id=756

ID:

ELRA-S0170

The BABEL Romanian Database is a speech database that was produced by a research consortium funded by the European Union under the COPERNICUS programme (COPERNICUS Project 1304). The project began in March 1995 and was completed in December 1998. The objective was to create a database of languages of Central and Eastern Europe in parallel to the EUROM1 databases produced by the SAM Project (funded by the ESPRIT programme).

The BABEL consortium included six partners from Central and Eastern Europe (who had the major responsibility of planning and carrying out the recording and labelling) and six from Western Europe (whose role was mainly to advise and in some cases to act as host to BABEL researchers). The five databases collected within the project concern the Bulgarian, Estonian, Hungarian, Polish, and Romanian languages.

The Romanian database consists of the basic "common" set which is:

* The Many Talker Set: 50 males, 50 females; each to read 4 connected passages, 1 block of 2-3 "filler" sentences, 4 phonemically compact sentences, 3-7 individual sentences, and 26 numbers.
* The Few Talker Set: 5 males, 5 females from the Many Talker Set; each to read additionally 3 blocks of syllables and, in 4 supplemental sessions, 16 connected passages, 4 blocks of 2-3 "filler" sentences, 4 repetitions of the 26 numbers.
* The Very Few Talker Set: 1 male, 1 female from the Few Talker Set; each to read additionally 5 pairs of context words and the syllables in these 5 contexts.

View resource description in all available languages

BABEL est une base de données qui a été produite par un consortium de recherche financé par la Commission européenne dans le cadre du programme COPERNICUS (Projet COPERNICUS 1304). Le projet a débuté en mars 1995 et s'est terminé en décembre 1998. Son objectif était de créer une base de données des langues d'Europe Centrale et de l'Est en parallèle à EUROM1 produit dans le cadre du projet SAM (financé par le programme ESPRIT) pour les langues de l'Union Européenne.

Le consortium de BABEL comprenait six partenaires d'Europe Centrale et de l'Est (ayant pour charge de planifier et réaliser l'enregistrement et l'annotation) et six partenaires de l'Europe de l'Ouest (dont le rôle principal a été de conseiller, et dans certains cas, d'héberger des chercheurs de BABEL). Les cinq bases de données collectées au cours de ce projet concernent les langues suivantes : bulgare, estonien, hongrois, polonais et roumain.

La base de données du roumain est composée d'un ensemble générique "commun":

* Le grand groupe de locuteurs : ensemble comportant 50 hommes et 50 femmes. Chaque locuteur a lu 4 passages connectés, 1 bloc de 2-3 phrases complémentaires, 4 phrases compactes au niveau phonémique, 3-7 phrases individuelles et 26 nombres.
* Le petit groupe de locuteurs : ensemble comportant 5 hommes et 5 femmes issus du grand groupe de locuteurs. Chaque locuteur a lu 3 blocs de syllabes, ainsi que au cours de 4 sessions supplémentaires, 16 passages connectés, 4 blocs de 2-3 phrases complémentaires, 4 répétitions et 26 nombres.
* Le très petit groupe de locuteurs : ensemble comportant 1 homme et 1 femme issus du petit groupe de locuteurs. Chaque locuteur a lu 5 paires de mots contextuels et les syllabes dans ces 5 contextes.

You don’t have the permission to edit this resource.

DistributionAvailability

Available - Restricted Use

Start date: 23/11/2004

Licence

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Non Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Members of ELRA

User Nature: Commercial

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Members of ELRA

User Nature: Academic

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Members of ELRA

User Nature: Academic

ELRA VAR

Restrictions: Commercial Use

For Non Members of ELRA

User Nature: Commercial

ELRA VAR

Restrictions: Commercial Use

For Non Members of ELRA

User Nature: Academic

ELRA END USER

Restrictions: Academic - Non Commercial Use

For Non Members of ELRA

User Nature: Academic

Contact Person

Mapelli Valérie

audio

Monolingual audio corpusLanguages

Romanian

Linguality

Linguality type: Monolingual

Size

no size available

Resource Creation

Funding Project

BABEL

Funding Type: Eu Funds

Metadata

Created: 12/05/2005

Version

Version: 1.0

Last Updated: 22/02/2007

People who looked at this resource also viewed the following:

Resources from the same project