Filosofian tohtori 2003 (tietokonelingvistiikka), Uppsalan yliopisto
Kieliteknologian professori 2015-, Helsingin yliopisto
Vieraileva professori 2009–2014, Uppsalan yliopisto, Ruotsi
Tutkijatohtori 2004–2009, Rijksuniversiteit Groningen, Alankomaat
Tutkimuskohteita:
Koneellinen kääntäminen, monikielinen tekstinkäsittely, kysymyksiin vastaaminen ja tiedon eristäminen
Kuva: Linda Tammisto
Tekstit: Jörg Tiedemann (Tomas Sjöblom, toim.)
Käännös: Tomas Sjöblom ja Tiia Niemelä
OPUS – Rinnakkainen ja avoin
Intensiivisen kesäkurssin jälkeen Norjan Rosendalin kauniissa ympäristössä vuonna 2003 istuin opiskelutoverini Lars Nygaardin kanssa kahvilassa juttelemassa tulevaisuudesta. Siellä syntyi ajatus avoimesta ihmisten tekemien käännösten kokoelmasta, joka olisi jokaisen hyödynnettävissä. Menimme kotiin mielessämme nimi, jonka olimme keksineet välineellemme: OPUS – the Open Parallel corpUS.
Aloitimme pienessä mittakaavassa, muutamalla avoimen lähdeaineiston hankkeista käännetyllä aineistolla. Ajatuksemme otettiin kuitenkin heti alusta alkaen vastaan positiivisesti. Yli kymmenen vuoden aikana kokoelma on kasvanut valtavasti, nykyään se sisältää yli 250 kieltä ja kielivarianttia sekä miljardeja sanoja eri verkkoalueilta. OPUS-sivustolla on nykyään yli 10 000 kävijää kuukaudessa, ja määrä on nousussa.
Aluksi OPUS oli melko ainutlaatuinen tarjotessaan materiaalia ilman sen suurempia rajoituksia. Tuolloin suurin osa tiedosta oli yhä lukittuna suljettujen ovien taakse ja tutkijoiden laatikkoihin, jotka pelkäsivät sen jakamista ties mistä syistä. Sittemmin avoimesti saatavilla olevien aineistojen hyödyt ovat käyneet ilmeisiksi, ja olen ylpeä siitä, että OPUS on ollut osa tätä kehitystä. Olen hyvin mielissäni, kun näen että tutkijat monilta eri aloilta ovat ryhtyneet hyödyntämään erilaisia saatavilla olevia resursseja.
Kokoelman pääasiallinen tarkoitus on tukea kieliteknologiaa, erityisesti tietopohjaista konekääntämistä. Mutta sen hyödyntämismahdollisuudet kielitieteessä, käännöstieteissä ja muilla humanistisilla aloilla (ja tietojenkäsittelytieteessä) käyvät yhä selvemmiksi. Joten miksi et opiskelisi kielen variaatioita elokuvien tekstitysten perusteella? Tai mitä jos tarkastelisit retoristen keinojen käyttöä eri kielissä Euroopan parlamentissa pidettyjen puheiden pohjalta?
Tutustu ja päätä itse, mitä OPUS voi tarjota. Siellä saattaa olla jotain myös sinulle.
Kirjoittaja
Jörg Tiedemann (Tomas Sjöblom, toim.) Käännös: Tomas Sjöblom ja Tiia Niemelä
Jörg Tiedemann
16.01.1972, Wernigerode, Saksa
Filosofian tohtori 2003 (tietokonelingvistiikka), Uppsalan yliopisto
Kieliteknologian professori 2015-, Helsingin yliopisto
Vieraileva professori 2009–2014, Uppsalan yliopisto, Ruotsi
Tutkijatohtori 2004–2009, Rijksuniversiteit Groningen, Alankomaat