Takaisin

Kimmo Koskenniemi

Kimmo Matti Koskenniemi
7.9.1945, Jyväskylä

FK 1967 (matematiikka), FL 1983 (yleinen kielitiede ja tietojenkäsittelyoppi), FT 1984 (yleinen kielitiede) Helsingin yliopisto

Tietokonelingvistiikan / kieliteknologian professori 1991–2012, Helsingin yliopisto
Suomen Akatemian vanhempi tutkija 1985–1990, Helsingin yliopisto
ATK-erikoistutkija 1981–1984, Suomen Akatemia / Helsingin yliopisto
Matemaatikko, jaostopäällikkö ja assistentti 1967–1980, Helsingin yliopiston laskentakeskus

Tutkimusteemat:
Automaattinen morfologinen analyysi eli sananmuotojen tunnistaminen ja siihen liittyvien menetelmien soveltaminen historialliseen kielitieteeseen sekä murteellisiin, vanhoihin tai muuten vaihtelua sisältäviin kielimuotoihin.

Julkaisutoiminta

Teksti: Kimmo Koskenniemi (Olli Siitonen, toim.)

Väitös ja morfologinen kaksitasomalli

Opiskeltuani sekä tietojenkäsittelyoppia että yleistä kielitiedettä etsin ratkaisuja yhdistämällä näiden tietoja. Menin tutkijaksi Fred Karlssonin vetämään Suomen Akatemian hankkeeseen (1981–1984), jossa selviteltiin suomen kielen automaattista tunnistamista.

Jo ensi kuukausina vieraaksi tuli Lauri Karttunen, joka toimi professorina Teksasin Austinissa. Kun hän kuuli, mitä suunnilleen olin ajatellut työni kohteeksi, pyysi hän minut myöhemmin keväällä Austinissa järjestettävään seminaariin, johon saapuivat erityisesti Ron Kaplan ja Martin Kay, jotka olivat työstäneet samantapaisia ajatuksia. Sain rahoituksen ja lähdin matkaan.

Prof. Fred Karlsson ja jaostopäällikkönäkin toiminut Kimmo Koskenniemi Yleisen kielitieteen laitoksella opettamassa tietokoneelle suomen kieltä. Kuva: 1983, Helsingin yliopistomuseo/Liisa Karvonen.

Sain tuoreeltaan kuvan heidän työstään ja oivalluksistaan. Menetelmä sopi hyvin englantiin, mutta suomen suhteen syntyi vaikeuksia, äännevaihteluiden paljouden johdosta. Työstin heidän ajatustensa ohella omiani joulukuuhun saakka, jolloin palaset putosivat paikalleen. Kaplanin ja Kayn peräkkäisen mallin sijasta sain toimimaan menetelmän rinnakkaisilla säännöillä. Näiden laatiminen oli yhtä helppoa kuin perinteistenkin ja tietokone pystyi toteuttamaan laajojakin säännöstöjä kevyesti. Näin syntyi ns. morfologinen kaksitasomalli, josta parin seuraavan kuukauden jälkeen oli valmiina teoria, alustava kuvaus suomen sanojen taipumisesta sen mukaan, sekä tietokoneohjelma, joka toteutti sanojen tunnistamisen käytännössä. Ohjelma oli kielestä riippumaton ja pian eri lingvistit tekivät yli tusinalle eri kielelle omia kaksitasokuvauksiaan. Keksityn menetelmän työstäminen väitöskirjaksi vei puolitoista vuotta.

Koskenniemen väitöstilaisuus, kuvassa mukana opponentti Lauri Karttunen (vas.) ja kustos Fred Karlsson. Kuva: Koskenniemen kotialbumi.

 

Takaisin