LUOMUS

Luonnontieteellinen keskusmuseo

Tietoaineistojen avoimen yhteiskäytön periaatteet

Tietoaineistojen avoimen yhteiskäytön periaatteet Luonnontieteellisessä keskusmuseossa

Periaatteet

Hyväksytty Luonnontieteellisen keskusmuseon johtokunnassa 10.3.2008 ohjeena periaatteessa noudatettavaksi. Toteutuksen yhteydessä ja kokemusten perusteella politiikkaa voidaan täsmentää.

Lisätietopyynnöt verkkotoimituksen osoitteeseen www(ät)luomus.fi tai postitse keskusmuseolle.

Perusteluissa (ks. alla) esitetyn johdosta keskusmuseossa noudatetaan seuraavia periaatteita tietoaineistojen avoimuudessa ja yhteiskäytössä.

  1. Viranomaisilta edellytettävän hyvän tiedonhallintatavan ja INSPIRE-direktiivin vaatimusten mukaisesti kaikki kokoelmat, tietokannat ja tiedostot luetteloidaan julkiseen metatietokantaan heti niiden syntymisen jälkeen. Siitä ilmenee myös aineiston saatavuustilanne.
  2. Kansalliskokoelmissa säilytettävien kokoelmayksilöiden tietokannat ovat rajoittamattomalla tarkkuudella saatavissa siltä osin kuin ne ovat digitaalisessa muodossa olemassa eivätkä koske tiettyjä uhanalaisia lajeja.
  3. Seurantatiedot ja muut lajitietoa sisältävät tietoaineistot tulevat rajoittamattomalla tarkkuudella saataviksi tietyn ajan kuluttua aineiston tulemisesta museolle, miksi ajaksi normaalitapauksessa lasketaan 5 vuotta. Havaitsijan itsensä tulee kuitenkin voida rajata paikan julkistamisen tarkkuus, mutta toisaalta myös voida edellyttää nopeampaa julkistamista.
  4. Erikseen voidaan sopia viranomaiskäyttäjien ja mahdollisesti yritysten kanssa aineistojen saannista aikaisemmin ja tarkemmin. Nämä palvelut olisivat maksullisia, kuten valtion maksuperustelaki edellyttää ja tapahtuisivat suojatun yhteyden kautta.
  5. Kaikki digitaaliset aineistot tulevat jo em. aikarajaa ennen välittömästi saataville rajoitetulla tarkkuudella, mistä tarkkuudesta vastuullinen tutkija itse päättää. Suosituksena on useisiin globaalianalyyseihin riittävä karkea tarkkuus, eli tieteellinen nimi (mielellään lajitasolla, mutta voi olla väljemminkin), vuosi sekä leveys- ja pituuspiiri lähimpään asteeseen pyöristettynä (eli noin 111 km etelä-pohjoissuunnassa, itä-länsisuunnassa napoja kohti kapeneva); ei muita yksityiskohtia.
  6. Tietyistä uhanalaisista lajeista, joiden kohdalla on perusteltua syytä epäillä tiedon väärinkäytön mahdollisuutta, ei missään vaiheessa julkisteta em. karkeaa tarkkuutta enempää. Uhanalaisten lajien tietojen julkistamisessa toimitaan yleensäkin ympäristöministeriön ohjeiden mukaan.
  7. Hyvän tavan vuoksi vapaaehtoisilta havaitsijoilta pyydetään jatkossa (mutta ei taannehtivasti) suostumus heidän havaintojensa julkistamiseen yksityiskohtaisemmin kuin 10 km tarkkuudella ja nimen mainitsemiseen.
  8. Tietoaineistojen metatiedossa kuvataan mahdollisuus tarkempaan datan saamiseen yhteyden ottamalla. Samoin edellytetään sui generis -lainsäädännön noudattamista siten, että lupa käyttöön on saatava, jos LTKM:n aineisto muodostaa tutkimuksessa laadullisesti tai määrällisesti oleellisen osan. Lupa pääsääntöisesti myönnetään, mutta yhteisjulkaisun mahdollisuudesta pyritään neuvottelemaan.
  9. Tietoaineistojen saatavuutta ja toteutunutta käyttöä seurataan ja se otetaan tulosmittarien pohjaksi museon sisällä ja ulospäin. Mm. rahoitusta hankkeille kanavoidaan tällä perusteella. Maksullisista palveluista saatavat tulot menisivät pääsääntöisesti datan tuottaneelle hankkeelle.

On selvää, että tämä merkitsee toimintakulttuurin muutosta, jonka omaksumiseen ja siitä hyötyjen saamiseen menee aikaa. Teknisestikään kaikkea ei voida toteuttaa muuten kuin vähitellen ja sitä mukaa, kun digitalisointi etenee. Tarkoitus on aloittaa näkyvästi suurimmista jo digitaalisista aineistoista aloittaen.

Perustelut ja taustaa avoimelle yhteiskäytölle

Miksi avoimuutta tarvitaan

Biologisissa tieteissä on eräiltä osin meneillään toimintatapojen muutos holistiseen, integroivaan, datasta riippuvaan tieteeseen. Tämä on vastakohta viime vuosikymmeninä vallinneeseen kokeelliseen, reduktionistiseen tieteeseen, jossa aineistot olivat usein pieniä ja tutkijakohtaisia.

Eräät aikamme tärkeimmistä ongelmista, kuten lajikato ja ilmastonmuutos ovat niin suuria ja maailmanlaajuisia, että yksittäiset tutkijat, tutkimusryhmät tai laitokset eivät enää voi kerätä yksinään niitä koskevia käyttökelpoisia aineistoja. Kysymyksiin vastaamiseksi tarvitaan aineistojen kokoamista kenties jopa sadoista eri lähteistä. Tämä edellyttää aineistojen käyttöoikeuksista päätettäessä uutta, avoimuuteen perustuvaa toimintatapaa.

Tämän pääasiallisen ajavan voiman lisäksi on muitakin samaan suuntaan vaikuttavia tekijöitä.

  1. Internetin kehittyminen on tehnyt tietojen keräämisen ja jakamisen sen kautta teknisesti helpoksi. Se on myös luonut uudenlaisen kulttuurin tiedosta yhteisenä hyvänä.
  2. Ihmisten tietoisuus ympäristöstä on lisääntynyt ja kansalaisilla katsotaan nykyään olevan oikeus ympäristöä koskevaan tietoon jopa sillä tasolla, että he voivat kysyä ”mitä takapihallani on ja tapahtuu”.
  3. Biodiversiteettiä koskevan tiedon erityispiirre on, että lajistoltaan rikkaat maat ovat usein kehitysmaita, joilla ei ole riittävää paikallista tiedeinfrastruktuuria luonnon piirteiden selvittämiseen. Niiden luontoa koskevat kokoelmat ovat usein kehittyneissä maissa, joilla on YK:n päättämä velvollisuus saattaa kehitysmaita koskeva tieto niiden saataville.
  4. Eräillä tieteenaloilla, kuten molekyyligenetiikassa on jo normi, että aineisto on laitettava avoimiin tietokantoihin, ennen kuin siihen perustuva tutkimus voidaan julkaista. Tieteellinen käytäntö on muuttunut: Ei riitä, että julkaisee tulokset – on julkistettava myös data. Tämä on hieman eri asia kuin se, että että data on perinteisesti vaadittu olevan saatavissa jo tehdyn raportin validointiin. Datan tulee olla saatavissa myös uusiin tutkimuksiin uusissa yhteyksissä.
  5. Luontoa koskevilla perushavainnoilla on universaaleja piirteitä, joiden perusteella niitä voidaan uudelleenkäyttää samaan tapaan kuin po. molekyylibiologian aineistoja. Jokaisella tietoaineistolla on ominaispiirteensä, mutta perushavainnoissa laji, paikka, aika ja havaitsija pysyvät. Seuranta-aineistot ja museoiden kokoelmayksilöt sisältävät aina tällaista tietoa.
  6. LTKM:n osalta on erityisesti todettava, että kokoelmiin ja seurantoihin perustuvaa julkaisutoimintaa on voitava tehostaa. Voidaan olettaa, että näiden aineistojen avaaminen laajempien tutkijapiirien käyttöön edistäisi tuloksellisuutta.

Näihin haasteisiin vastaaminen edellyttää uusien yhteistoimintamallien ja tietoinfrastruktuurin kehittämistä. Tarvittava uusi yhteistoimintamalli on nimenomaan avoimuuden lisääminen ja tietoaineistojen yhteiskäytön ottaminen normaaliksi käytännöksi.

Tätä tukevaa tietoinfrastruktuuria on kehitetty viime vuosina voimallisesti. Suomikin on jäsenenä Global Biodiversity Information Facility (GBIF) -järjestössä, jonka kautta on jo saatavissa noin 140 miljoonaa luontohavaintoa yli tuhannesta tietokannasta 40 maassa. Suomessa on GBIF:n kautta saatu yhteiskäyttöön vasta hyvin pieni osa aineistoista. Huomattakoon, että GBIF/TDWG protokollia voidaan käyttää yhtä hyvin maan sisällä kuin kansainvälisestikin.

Tekniikan lisäksi tarvitaan myös uusia sopimuskäytäntöjä, jotta avoimuutta ja tietojen yhteiskäyttöä voidaan edistää. Tietoaineistojen käytön on GBIF-sopimuksenkin nojalla tapahduttava ”in framework of due attribution”, eli tekijöiden panoksen tunnustaen. Mikä tämä laillinen, sopimuksellinen ja tiedeyhteisön normeihin perustuva tausta olisi, on tässä muistiossa tarkastelun kohteena. Lopuksi tehdään ehdotus LTKM:n toimintatavaksi tällä alueella.

Mihin julkisuus ja julkistaminen perustuu

Tietokannoissa ja tiedostoissa olevien aineistojen julkisuuteen liittyy useita eri kysymyksiä, joita Alfred Streng (Streng & Herler 2007) on tarkastellut LTKM:n kutsumana asiantuntijana.

Tekijänoikeuslainsäädännön mukaan tietokanta nauttii suojaa, jos se ylittää ns. teoskynnyksen. Sen laatimisen on täytynyt vaatia huomattavaa työpanosta, ammattitaitoa ja pääomaa. Tiedot itsessään ovat suojaamattomia – ne ovat suojattuja vain kokonaisuutena. Erityinen luettelosuoja antaa kuitenkin mahdollisuuden kieltää vastaavien kilpailevien kopioiden julkistamisen. EU:ssa sovellettu sui generis -sääntö kieltää tietokannan tiedoista otteen tekemisen ja uudelleenkäytön ilman tekijän lupaa, mikäli kyseessä on laadullisesti tai määrällisesti oleellinen osa tietokannasta. Tietokannan omistaa se henkilö tai ryhmä, joka sen on laatinut. Omistaja on se, joka tekee työstä aloitteen ja ottaa riskin inves­toinneista. Tekijänoikeudet kuuluvat työnantajalle, jos tietokanta on laadittu osana työ- tai virka­suhteeseen kuuluvia työtehtäviä. Tutkijoille on säädetty erityinen oikeus käyttää kopio­suojattuakin aineistoa puhtaasti tieteellisessä tarkoituksessa ja julkistaa se tiedeyhteisön kriittistä tarkastelua varten.

Laki viranomaisten asiakirjojen julkisuudesta säätää ne julkisiksi, ellei muuta ole erikseen säädetty. Tämä koskee myös tietokantoja ja niitä tietoja, joita ulkopuoliset ovat viranomaiselle toimittaneet sen tehtäväalaan kuuluvassa asiassa. On todettava, että LTKM ei ole viranomainen lain tarkassa merki­tyksessä. Tässä ja eräissä muissakin laeissa kuitenkin todetaan, että mitä viranomaisesta säädetään, koskee myös lain tai asetuksen nojalla annetun säännöksen tai määräyksen perusteella julkista tehtävää hoitavia yhteisöjä, laitoksia, säätiöitä ja yksityisiä henkilöitä niiden käyttäessä julkista valtaa.

Viranomaisen tulee hyvän tiedonhallintatavan luomiseksi ja toteuttamiseksi huolehtia asiakirjojen ja tietojärjestelmien sekä niihin sisältyvien tietojen asianmukaisesta saatavuudesta, käytettävyydestä ja suojaamisesta sekä eheydestä ja muusta tietojen laatuun vaikuttavista tekijöistä. Tämä edellyttää mm. niiden julkista luettelointia, ja että tietojärjestelmä on suunniteltu niin, että asiakirjojen julkisuus voidaan vaivattomasti toteuttaa.

Julkisuuden toteuttaminen mahdollisimman laajasti on Strengin ja Herlerin (2007) mukaan pääsääntö ja lähtökohta, ja siitä poikkeaminen on sallittava vain ahtaissa rajoissa. Salassa pidettäviä viranomaisen asiakirjoja ovat lain 24§ mukaan, jollei erikseen toisin säädetä:

  1. (14) asiakirjat, jotka sisältävät tietoja uhanalaisista eläin- tai kasvilajeista tai arvokkaiden luonnonalueiden suojelusta, jos tiedon antaminen niistä vaarantaisi kysymyksessä olevan eläin- tai kasvilajin tai alueen suojelun;
  2. (16) tilastoviranomaiselle tilastojen laatimista varten annetut asiakirjat samoin kuin asiakirjat, jotka on vapaaehtoisesti annettu viranomaiselle tutkimusta tai tilastointia varten;
  3. (21) asiakirjat, jotka koskevat opinnäytetyön tai tieteellisen tutkimuksen suunnitelmaa tai perusaineistoa taikka teknologista tai muuta kehittämistyötä tai niiden arviointia, jollei ole ilmeistä, että tiedon antaminen niistä ei aiheuta opinnäytetyön, tutkimuksen tai kehittämistyön suorittamiselle taikka niiden hyödyntämiselle tai sen asianmukaiselle arvioinnille tai tutkijalle taikka tutkimuksen tai kehittämistyön toimeksiantajalle haittaa;

Näiden osalta on oikean tulkinnan löytäminen tärkeää. Strengin ja Herlerin (2007) mukaan 14 kohtaa sovelletaan vain, jos on aihetta epäillä tietojen väärinkäyttöä, mikä arvio on tehtävä tapauskohtaisesti. Tilastolain mukaan LTKM ei ole tilastoviranomainen, vaan ns. muu tilastoja laativa viranomainen, joka päättää itse tietojensa julkisuudesta. Vapaaehtoisesti viranomaiselle tutkimusta varten annetut tiedot on tutkijan joka tapauksessa mahdollisuus saattaa tiedeyhteisön tarkasteluun, mutta sui generis -oikeuksien omistajalta on hyvä pyytää tähän suostumus. Tällaisten tietojen tultua käsitellyksi ja päädyttyä viranomaisen tietokantaan, niitä koskevat samat julkisuussäädökset kuin muitakin asiakirjoja. Mitä tulee kohtaan 21, se antaa LTKM:lle tutkimuksen toimeksiantajana periaatteessa mahdollisuuden jonkin aikaa olla julkistamatta aineistojaan, mutta jossakin vaiheessa haittaa ei enää voida pitää niin suurena, että se ylittäisi pääsäännön.

Muina asiaan vaikuttavina säädöksinä on mainittava ns. Århusin sopimus, joka antaa allekirjoittaja­maiden kansalaisille oikeuden ympäristöä, ml. biodiversiteettiä, koskevan tiedon saantiin. Samoin EU:n INSPIRE-direktiivi edellyttää mm. luontoa koskevan tiedon metatieto-, selaus-, ja latauspalveluiden aikaansaamista. INSPIRE:n käytännön toteutukset ovat kuitenkin vielä auki. Kansallinen biodiversiteettistrategia ja toimintaohjelma edellyttävät, että ”luonnon monimuotoisuutta koskevat tiedot tulee järjestää siten, että ne ovat helposti saatavilla riippumatta siitä missä ja kenen toimesta ne on kerätty”, ja että ”järjestetään luonnon monimuotoisuutta koskevan tiedon hallinta verkostoperiaatteella yhteistyönä luonnon monimuotoisuuden tutkimukseen ja seurantaan osallistuvien tahojen välillä. Tavoitteeksi asetetaan, että kaikki aihetta koskeva yhteiskunnan tukema tai kustantama tieto on vapaasti ja mahdollisimman pienin kustannuksin saatavilla.”

Sopimustie on aina mahdollinen avoimuuden periaatteista päätettäessä. Esim. Britannian biodiversiteettverkosto (NBN Trust 2004) perustuu kattavaan havaitsijalta loppukäyttäjään ulottuvaan sopimusverkkoon, jossa jokainen vaihe antaa lisäarvoa ja saa siten oikeuksia. GBIF Data Sharing Agreement ja Data Use Agreement ovat yksinkertaisia sopimuksia, jotka on hyväksyttävä ennen palvelimen rekisteröintiä tai tietojen käyttöä. Open source -liike perustuu GNU Public License -sopimukseen. Tällaisista sopimuksista, jos ne eivät ole vakioituja koko tiedeyhteisössä, tulee kuitenkin helposti selvittämätön vyyhti, mitä voidaan kritisoida (Science Commons 2007).

Miten tietokantojen avoin yhteiskäyttö voidaan toteuttaa

Edellä esitetyn perusteella voidaan todeta, että LTKM on minimitason yläpuolella vapaa valitsemaan haluamansa avoimen yhteiskäytön tason. Minimissään avoin yhteiskäyttö koskee metatietoja ja museon kansalliskokoelmien kokoelmatietokantoja. Maksimissaan kaikki tutkimus- ja seuranta-aineistot laitetaan heti niiden saamisen jälkeen sellaisenaan nettiin lukuunottamatta uhanalaisten lajien tarkkoja keruutietoja. Sopiva tasapaino näiden välillä on oltava tavoitteena.

Lähtökohtana on tahto siitä, mitä minimitason yli menevällä avoimella yhteiskäytöllä tavoitellaan. Tällaisina mahdollisina tavoitteina, joihin yhteiskäytöllä voidaan ehkä vastata voidaan esittää ainakin seuraavia:

  • Kokoelmien käyttöä voidaan tehostaa ja käyttöä seurata paremmin.
  • Seurannat ovat suunnitelmallisia ja kustannustehokkaita, ja ne tuottavat korkeatasoisia julkaisuja ja tarkkoja tilastoja.
  • Kokoelmien ja seurantojen ympärille saadaan syntymään laajempaa tutkimusyhteistyötä ja rahoitusta.
  • Museon tutkijat ovat mukana useammassa julkaisussa kuin nykyään.
  • Harrastajakuntaa, joka tuottaa valtaosan seurantatiedosta, voidaan motivoida entistäkin paremmin, eikä sen osallistumista seurantoihin millään tavalla vaaranneta, vaan päinvastoin lisätään, mikäli mahdollista.
  • Museon pitkäaikaisia ja historiallisia tietoja käytetään globaalimuutoksen analysoimisessa.
  • Uusien lajien kuvaamista voidaan nopeuttaa globaalisti.
  • Luontohavaintoja voidaan käyttää ympäristön hoidon ja suojelun tehtävissä kentällä.

Kuinka yhteiskäyttö tarkkaan ottaen auttaisi näihin ja muihin mahdollisiin tavoitteisiin pääsemiseksi on syytä keskustella museon tutkijakunnan parissa perusteellisesti. Samoin mitä haittoja yhteiskäytöstä olisi. Vertailukohdaksi on myös syytä ottaa se, mitä naapurimaissamme on tapahtunut ja tapahtumassa. Tiede on maailmanlaajuista ja kun aineistoja integroidaan tässä mittakaavassa, Suomi ei voi olla valkoinen läiskä kartalla. Toinen asia on, että detailjitason tietoa ei globaalitason tutkimusyhteistyössä välttämättä tarvita.

Viitteet

Sivun vastuuhenkilö: 
Mikko Heikkinen
2.1.2015