ILSP PsychoLinguistic Resource
View resource name in all available languages
Ψυχογλωσσολογικός πόρος IPLR
IPLR
Word lists with corresponding quantitative lexical and sub-lexical properties (e.g. frequency for words and word parts, phone bigrams, stress, orthographic neighbours, transparency score etc.) useful to psycholinguistic research. All lists are provided as Microsoft Excel files, compressed into rar format.
The following files are included:
- Full processed corpus word list with all quantitative measures, both incl. and ignoring stress.
- Tables of orthographic and phonological syllables, with associated frequency of occurrence. The syllables are ranked in order of decreasing type or token frequency.
- Tables of type and token counts for letter bigrams and phone bigrams, with or without stress diacritics. When calculated with stress diacritics, each marked letter is treated as a separate letter (e.g., α is distinct from ά). When calculated without stress diacritics these are obviously collapsed into the same letter category.
- Grapheme/phoneme-level analysis of orthographic transparency in both directions. This table contains bidirectional mapping lists between letters-phones and graphemes-phones.
- Word-type and word-token statistics for all quantitative measures. Lists descriptive statistics (mean, minimum, maximum, skewness, kurtosis) and selected percentiles for each quantitative measure, based on the CLEAN corpus, for word types and word tokens, separately with and without taking stress into account.
View resource description in all available languages
Κατάλογοι λέξεων με αντίστοιχες ποσοτικές λεξικές και υπολεξικές ιδιότητες/μετρήσεις (συχνότητες συνόλου και μερών της λέξης, φωνολογικά bigrams, τόνος, ορθογραφικοί και άλλοι γείτονες, σκορ διαφάνειας κ.ά.) χρήσιμες για ψυχογλωσσολογική έρευνα. Όλοι οι κατάλογοι είναι σε μορφή Microsoft Excel, συμπιεσμένοι σε rar format.
Περιλαμβάνονται τα ακόλουθα αρχεία:
- Πλήρως επεξεργασμένος κατάλογος λέξεων του σώματος κειμένων με όλες τις ποσοτικές μετρήσεις, με τόνο και όχι.
- Πίνακες ορθογραφικών και φωνολογικών συλλαβών, με τη σχετική συχνότητα εμφάνισης. Οι συλλαβές παρουσιάζονται κατά φθίνουσα σειρά με βάση τη συχνότητα εμφάνισης του τύπου ή της μονάδας.
- Πίνακες με μετρήσεις τόσο των τύπων όσο και των μονάδων bigrams γραμμάτων και φωνολογικών bigrams με, αλλά και χωρίς, τόνο. Όταν λαμβάνεται υπόψη ο τόνος, κάθε τονισμένο γράμμα θεωρείται ξεχωριστή περίπτωση (π.χ. το α διακρίνεται από το ά). Όταν δεν λαμβάνεται υπόψη ο τόνος, τότε οι δύο προαναφερθείσες περιπτώσεις συγκλίνουν σε μία κοινή κατηγορίας.
- Ανάλυση της ορθογραφικής διαφάνειας σε επίπεδο γραφήματος/φωνήματος. Ο πίνακας αυτός περιλαμβάνει αμφίδρομη αντιστοίχιση μεταξύ γραμμάτων-φωνημάτων και γραφημάτων-φωνημάτων.
- Στατιστικές πληροφορίες για όλες τις ποσοτικές μετρήσεις λέξης-τύπου και λέξης-μονάδας. Κατάλογοι περιγραφικής στατιστικής (μέσος όρος, ελάχιστο, μέγιστο, ασυμμετρία, κύρτωση) και επιλεγμένα εκατοστημόρια για κάθε ποσοτική μέτρηση, βάσει του CLEAN corpus, για τύπους και μονάδες λέξεων, με ή χωρίς τόνο, χωριστά.
- web documents pertaining to politics, health, and travel domains
People who looked at this resource also viewed the following:
People who downloaded this resource also downloaded the following: