Verbmobil is a long-term project of the German Federal Ministry of Education, Science, Research and Technology (BMBF, Projekträger DLR). Its aim is to give Germany an international top position in language technology and its economical application in the next millenium by cooperation and concentration of as many as possible specialists from industry and science. The long-sighted aim is the development of a mobile translation system for the translation of spontaneous speech in face-to-face situations.The following resources are spontaneous speech databases recorded in a dialogue task (appointment scheduling) . VM CD 12.1 (new edition) consists of 1 CD-ROM with 207 Dialogues, 207 Appointments, 2,154 Turns in German. This new edition contains the transliterations of all dialogues, signal files with PhonDat 2 Header structure, software and speaker documentation and partitur files (files describing the different parts which constitute the corpus - word order, phrase order, etc.). All files were validated according to BAS guidelines.
View resource description in all available languages
Verbmobil est un projet du Ministère fédéral allemand de l'Education, des Sciences, de la Recherche et des Technologies (BMBF, Projekträger DLR), qui vise à placer l'Allemagne en position de force dans le domaine de l'ingénierie de la langue. Son objectif , à long terme, est de développer un système de traduction vocale automatique, pour la traduction de conversations spontanées. Ces ressources sont des enregistrements de conversation pour la prise de rendez-vous. Le corpus allemand comprend 13 910 occurrences (échanges). L'édition de BAS de la partie allemande est entièrement étiquetée et segmentée en unités phonémiques/phonétiques (alphabet SAM-PA) par le système MAUS et partiellement segmentée de manière manuelle. VM CD 12.1 - VM121 (nouvelle édition) contient 1 CD-ROM composé de 207 dialogues, 207 rendez-vous, 2,154 échanges en allemand. Cette nouvelle édition contient les transcriptions de tous les dialogues, les fichiers de signaux avec une structure d'entête PhonDat 2, la documentation du logiciel et des locuteurs et les fichiers 'partitur' (fichiers décrivant les différentes parties constituant le corpus (ordre des mots, ordre des phrases, etc.)). Tous les fichiers ont été validés selon les directives de BAS.