Hellenic National Corpus

View resource name in all available languages

Ελληνικός Θησαυρός της Ελληνικής Γλώσσας

ΕΘΕΓHNC

The HNC currently contains about 47.000.000 words, and is constantly being updated. It consists of samples of written language exclusively. Texts in the HNC represent modern Greek language use - most of them having been written after 1990. Texts written in highly idiomatic language have been excluded. Most texts have been selected based on their high readability (high circulation newspapers, best-selling books etc.). Texts from several media, belonging to different genres and dealing with various topics have been selected. These texts have been given to ILSP for this purpose by copyright owners and are available for research purposes only.

View resource description in all available languages

Σώμα γενικής γλώσσας της ΝΕ, συνολικού μεγέθους 47 εκατ. λέξεων, το οποίο συνεχώς εμπλουτίζεται με νέα κείμενα. Τα κείμενα που περιλαμβάνονται στον ΕΘΕΓ έχουν επιλεγεί ως αντιπροσωπευτικά της σύγχρονης ελληνικής γλώσσας και χρονολογούνται, στην πλειονότητά τους, από το 1990 και μετά. Αποφεύγονται τα κείμενα με διαλεκτικές ή άλλες ιδιαιτερότητες και προτιμώνται κείμενα με υψηλή αναγνωσιμότητα (εφημερίδες μεγάλης κυκλοφορίας, βιβλία με υψηλές πωλήσεις κτλ). Με στόχο την αντιπροσώπευση διαφορετικών επιπέδων λόγου, επιλέχθηκαν κείμενα από πολλές πηγές, που καλύπτουν ποικίλα κειμενικά είδη με ποικίλη θεματολογία. Τα κείμενα έχουν παραχωρηθεί στο ΙΕΛ με απώτερο σκοπό τη χρήση τους για ερευνητικούς σκοπούς.

You don’t have the permission to edit this resource.
  • HNCedit
    • HNCedit