Oulu Corpus
View resource name in all available languages
Oulun korpus
ID:
http://urn.fi/urn:nbn:fi:lb-201403266
http://islrn.org/resources/875-594-014-737-2
The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: https://kitwiki.csc.fi/twiki/bin/view/FinCLARIN/KielipankkiAccessRights).
The Oulu Corpus is a research material of the standard Finnish language in 1960's. Its collection was led by prof. Pauli Saukkonen. The research material was converted later, in 1997, into an SGML format by the Research Institute for the Languages of Finland.
The corpus project aimed at creation of a corpus that contains a representative sample of the Finnish language in the 1960's media. The corpus does not include the language as used in television.
The corpus can be divided into the following genres:
- fiction literature published in 1961 - 1967
- radio talks during 29 September 1968 - 26 May 1969
- newspapers and journals in 1967
- non-fiction literature 1961 - 1967
It has been grammatically annotated using CQP (Corpus Query Processor).
Details on license are available at http://urn.fi/urn:nbn:fi:lb-20150304136
The purpose of the resource use must be outlined in a research plan.
More information on the corpus: http://urn.fi/urn:nbn:fi:lb-2014060311
View resource description in all available languages
Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. http://www.kielipankki.fi/KielipankkiKayttooikeudet).
Oulun korpus on 1960-luvun suomen yleiskielen sähköinen tutkimusaineisto, joka on tutkimuskeskuksessa muunnettu SGML-muotoon. Ulkopuoliset tutkijat voivat käyttää Oulun korpusta tutkimustarkoituksiin CSC:n Kielipankissa.
Aineisto on muutettu siitä analysoidusta tekstimateriaalista, joka alun perin
koottiin Oulussa Suomen kielen taajuussanastoa varten. Tekstimateriaaliin
kuului
1) vuosina 1961-1967 ilemestynyt suomenkielinen kaunokirjallisuus
2) radiolle tarkoitetut puheohjelmat 29.9.1968 - 26.5.1969
3) 1967 ilmestyneet sanoma- ja aikakauslehdet
4) vuosina 1961-1967 ilmestynyt suomenkielinen tietokirjallisuus
Tekstit ovat satunnaisesti valittuja otoksia.
Annotointi on tehty CQP:n (Corpus Query Processor) avulla.
Tarkemmat tiedot lisenssistä löytyvät osoitteesta http://urn.fi/urn:nbn:fi:lb-20150304136
Kielivaran käyttötarkoitus tulee määritellä tutkimussuunnitelmassa.
People who looked at this resource also viewed the following: