Frequencies of Early Modern Finnish Words

View resource name in all available languages

Varhaisnykysuomen sanojen taajuuksia

ID:

http://urn.fi/urn:nbn:fi:lb-20140730139

http://islrn.org/resources/197-982-062-166-4

The list includes the word forms included in the corpus of old literary Finnish of the Institute for the Languages of Finland together with their frequency information.

License EUPL (http://ec.europa.eu/idabc/en/document/7774.html).

Access location: http://kaino.kotus.fi/sanat/taajuuslista/vks.php.

View resource description in all available languages

Taajuuslistaan sisältyvät Kotuksen vanhan kirjasuomen tekstikorpuksessa esiintyvät sananmuodot taajuustietoineen.

Teksti on käsitelty ennen sananmuotojen laskemista siten, että isot kirjaimet on muutettu pieniksi ja tekstistä on poistettu kaikki ne merkkijonot, jotka eivät sisällä yhtäkään numeroa tai kirjainta, mm. välimerkit. Lista on järjestetty siten, että yleisin sananmuoto on listassa ensimmäisenä. Näin määriteltynä korpuksessa on sanoja 3 425 382 kappaletta.

Taajuuslistassa jokaiseen sananmuotoon liittyy sen taajuudenmukainen järjestysluku, sen esiintymien lukumäärä aineistossa ja sananmuodon esiintymien suhteellinen osuus prosentteina aineiston kaikista saneista.

Lisenssi EUPL (http://ec.europa.eu/idabc/en/document/7774.html).

You don’t have the permission to edit this resource.