Greek Textual Entailment Corpus

View resource name in all available languages

Ελληνικό Σώμα Κειμενικής Συνεπαγωγής GTEC


GTEC consits of 600 T-H pairs manually annotated for entailment (i.e. whether T entails H or not) by human annotators. The dataset which is tailored to guide training and evaluation of prospect RTE systems, is equally divided in three subsets each one representing the output of a specific HLT application: Question Answering (QA), Comparable Documents (CD) and Machine Translation (MT), and pertaining to specific subject fields (e.g. law, politics, travel). T-H examples that correspond to success and failure cases of the afore-mentioned applications have been included in the corpus. The annotations provided are conformant to the RTE1 and RTE2 challenges.

View resource description in all available languages

Το Ελληνικό Σώμα Κειμενικής Συνεπαγωγής (Greek Textual Entailment Corpus, GTEC) αποτελείται από 600 ζεύγη T-H (κείμενο συνεπαγωγής & συνεπαγώμενη υπόθεση) τα οποία έχουν επισημειωθεί ως προς το αν η πρόταση T συνεπάγεται την πρόταση Η από ανθρώπους επισημειωτές σύμφωνα με το σχήμα επισημείωσης που χρησιμοποιήθηκε στις δοκιμασίες RTE1 & RTE2.
Τα δεδομένα είναι οργανωμένα σε τρεις υποομάδες, οι οποίες αντιστοιχούν σε τρεις εφαρμογές Γλωσσικής Τεχνολογίας (συστημάτα Ερωταποκρίσεων, Συγκρίσιμων Αρχείων και Μηχανικής Μετάφρασης), και ανήκουν σε τρεις γνωστικούς τομείς (νομικά, πολιτική & ταξίδια). Στο σώμα περιλαμβάνονται παραδείγματα επιτυχούς και ανεπιτυχούς συνεπαγωγής.

You don’t have the permission to edit this resource.
  • ILSP FBT POS tagger
  • ILSP-Lemmatizer
  • web news
  • EU texts