Turkish Continuous and Isolated Word Speech Database

View resource name in all available languages

Base de données orale du turc

ID:

ELRA-S0121

This Turkish speech database was produced by the department of Théorie des Circuits et Traitement de Signal at the Faculté Polytechnique de Mons. The corpus was designed to provide read speech data for speech recognition purposes. The database contains 14 hours of speech (1618 words) from 43 Turkish speakers (adults over 18; 22 males, 21 females) from Belgium, Germany and Turkey (Istanbul, Ankara, Malatya), recorded at 32 kHz on DAT by Sennheiser MD-441-U microphone. The speech signal was sampled at 16 kHz and digitised with 16 bits. Each speaker read a predetermined text of 215 sentences and 100 isolated words, in quiet conditions. Parts of the corpus were labelled and segmented phonemically. Phonetic and orthographic transcriptions of sentences and isolated words are provided.

View resource description in all available languages

Cette base de données orale du turc a été produite par le département de Théorie des Circuits et Traitement de Signal de la Faculté Polytechnique de Mons. Le corpus oral lu pourra être utilisé pour la reconnaissance de la parole. La base de données contient au total 14 heures (1618 mots) de discours lu par 43 locuteurs turcs (adultes âgés de plus de 18 ans; 22 hommes, 21 femmes) de Belgique, d'Allemagne et de Turquie (Istanboul, Ankara, Malatya), enregistrés à 32 kHz sur un système DAT par un microphone Sennheiser MD-441-U. Les signaux sont échantillonnés à 16 KHz avec une résolution de 16 bits. Chaque locuteur a lu un texte de 215 phrases et 100 mots isolés, dans un environnement calme. Quelques parties du corpus ont été étiquetées et segmentées de façon phonémique. Les transcriptions phonétiques et orthographiques des phrases et des mots isolés sont également fournies.

You don’t have the permission to edit this resource.