CHIL 2004 Evaluation Package

View resource name in all available languages

Package d’évaluation CHIL 2004

ID:

ELRA-E0009

The CHIL 2004 Evaluation Package was produced within the CHIL Project (Computers in the Human Interaction Loop), in the framework of an Integrated Project (IP 506909) under the European Commission's Sixth Framework Programme. The objective of this project is to create environments in which computers serve humans who focus on interacting with other humans as opposed to having to attend to and being preoccupied with the machines themselves. Instead of computers operating in an isolated manner, and Humans [thrust] in the loop [of computers] we will put Computers in the Human Interaction Loop (CHIL).

In this context, the CHIL project produced CHIL Seminars. The CHIL Seminars are scientific presentations given by students, faculty members or invited speakers in the field of multimodal interfaces and speech processing. During the talks, videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker’s voice and ambient sounds were recorded.

The CHIL Seminars have been compiled in four different packages, according to the evaluations for which they have been created and used:
- CHIL 2004 Evaluation Package (catalogue reference ELRA-E0009)
- CHIL 2005 Evaluation Package (catalogue reference ELRA-E0010)
- CHIL 2006 Evaluation Package (catalogue reference ELRA-E0017)
- CHIL 2007 Evaluation Package (catalogue reference ELRA-E0033)

The CHIL_2004 Evaluation Package consists of the following contents:

The whole set of recordings amounts to a total of almost 6 hours of audio recordings and more than 2 hours of video recordings. The language is European English spoken by non native speakers. The recordings comprise the following: videos of the speaker and the audience from 4 fixed cameras, frontal close ups of the speaker, close talking and far-field microphone data of the speaker’s voice and background sounds.

The database consists of:
1) Audio and Video Recordings: 10 seminars (7 seminars recorded from October to December 2003 and 3 seminars recorded in June 2004).
2) Annotations: Video annotations done displaying 1 over 10 pictures in sequence, for the 4 cameras.
3) Transcriptions: Transcriptions using both TRS and STMUID formats.

View resource description in all available languages

Le package d’évaluation CHIL 2004 a été produit dans le cadre du projet CHIL (Computers in the Human Interaction Loop), issus d’un projet intégré (IP 506909) du sixième programme-cadre de la Commission européenne. Le projet CHIL a pour objectif d’améliorer les échanges et l’interactivité entre utilisateurs humains et ordinateurs, par exemple grâce à des modes de communications plus efficaces et adaptés. CHIL prévoit ainsi que les ordinateurs et systèmes s’adaptent à la demande, grâce à l’observation et à la compréhension des besoins des utilisateurs.

Dans ce contexte, le projet CHIL a produit des séminaires CHIL. Les séminaires CHIL sont des présentations scientifiques faites par des étudiants, des membres universitaires ou des locuteurs invités dans le domaine des interfaces multimodales et du traitement de la parole. Pendant ces présentations, ont été enregistrées des vidéos du locuteur et des autres participants à partir de 4 caméras fixes, des prises de vues rapprochées du locuteur, des données contenant des enregistrements de la voix du locuteurs sur micro-cravate et via des microphones placés à distance (« far-field »), ainsi que l’enregistrement des sons ambiants.

Les séminaires CHIL ont été compilés sous la forme de quatre packages différents, en fonction des évaluations pour lesquelles ils sont été créés et utilisés:
- Package d’évaluation CHIL 2004 (référence catalogue ELRA-E0009)
- Package d’évaluation CHIL 2005 (référence catalogue ELRA-E0010)
- Package d’évaluation CHIL 2006 (référence catalogue ELRA-E0017)
- Package d’évaluation CHIL 2007 (référence catalogue ELRA-E0033)

Le package d’évaluation CHIL_2004 comprend les contenus suivants :

L’ensemble des enregistrements se monte à un total de près de 6 heures d’enregistrements audio et plus de 2 heures d’enregistrements vidéo. La langue est de l’anglais européen parlé par des locuteurs dont l’anglais n’est pas la langue maternelle. Les enregistrements des vidéos du locuteur et des autres participants à partir de 4 caméras fixes, des prises de vues rapprochées du locuteur, des données contenant des enregistrements de la voix du locuteurs sur micro-cravate et via des microphones placés à distance (« far-field »), ainsi que l’enregistrement des sons ambiants.

La base de données comprend :
1) Des enregistrements audio et vidéo : 10 séminaires (7 séminaires enregistrés d’octobre à décembre 2003 et 3 séminaires enregistrés en juin).
2) Des annotations: annotations vidéo réalisées à partir d’une image sur dix en séquence, pour les 4 caméras.
3) Des transcriptions: transcriptions utilisant à la fois les formats TRS et STMUID.

You don’t have the permission to edit this resource.