Suomen Lajitietokeskuksen havaintojen tietovarasto

Lajitietokeskus ylläpitää valtakunnallista tietovarastoa, jonne kopioidaan jäsenorganisaatioiden aineistojen havaintojen ja kokoelmanäytteiden tietoja. Havainnot ja kokoelmanäytteiden tiedot ovat pohjimmiltaan lajin esiintymistietoa tietyssä paikassa tiettynä aikana. Tietovarastoa voidaan käyttää kansallisena lajitiedon analysointi- ja raportointipalveluna.

Tietovarastossa on kaksi puolta: julkinen ja suljettu puoli.

  • Julkisen tietovaraston tiedot ovat kaikkien selailtavissa ja ladattavissa laji.fi -portaalin kautta. Niitä voi myös kuka tahansa käyttää omassa sovelluksessaan api.laji.fi -avoimen rajapinnan kautta. Julkisen tietovaraston tiedot voivat kuitenkin olla karkeistettu.
  • Suljettu tietovarasto pitää sisällään kaikkien havaintojen tarkat ja karkeistamattomat tiedot. Suljettun tietovaraston tietoja selataan Lajitietokeskuksen viranomaisportaalissa ja luotetut sovellukset voivat käyttää niitä api.laji.fi -rajapinnan suljetun puolen kyselyillä. Julkisesta laji.fi -portaalista on kenen tahansa mahdollista tehdä aineistopyyntö koskien suljettua tietoa.

Tietovarasto on sekundaarijärjestelmä

Tietojärjestelmät voidaan jakaa primaari- ja sekundaarijärjestelmiin. Kullekin havainnolle tulisi määritellä täsmälleen yksi primaarijärjestelmä, jossa kyseistä tietoa ylläpidetään. Lajitietokeskuksen tietovarastoon kopioidaan määräajoin havaintojen tiedot primäärijärjestelmistä. Tietovarasto on siis sekundaarijärjestelmä, eli sen tietosisältöä ylläpidetään joissakin muissa järjestelmissä. Näin ollen tietovaraston sisältöä ei koskaan muokata tai korjailla, vaan korjaukset tehdään primäärijärjestelmiin, joista muutokset välitetään tietovarastoon.

Kukin Lajitietokeskuksen jäsenorganisaatio voi ylläpitää omia primaarijärjestelmiään tai käyttää Lajitietokeskuksen tarjoamia primaaritiedon hallintapalveluita. Näistä tärkeimmät ovat Lajitietokeskuksen havaintotietojärjestelmä Laji.fi Vihko ja luonnontieteellisten kokoelmien hallintaan tarkoitettu Kotka.

Lajitietokeskuksen ylläpitämistä primaarijärjestelmistä tieto replikoidaan automaattisesti Lajitietokeskuksen tietovarastoon. Muista järjestelmistä tiedot kopioidaan määrävälein. Kopioinnin aikaväli voi vaihdella lähes reaaliaikaisesta päivän, viikon tai vuoden välein tehtävään replikointiin.

Laadunvalvonta  Annotointi

Vaikka tietovaraston sisältöä ei muokata, tietovaraston havaintojen laatua voidaan kuitenkin valvoa annotoimalla niitä. Annotointi tarkoittaa uuden tiedon liittämistä alkuperäiseen tietoon. Annotointeja tallennetaan omaan Lajitietokeskuksen ylläpitämään primäärijärjestelmään. Lajitietokeskuksen tietovarastossa alkuperäisen havainnon tiedot ja siihen Lajitietokeskuksessa liitetyt annotoinnit kohtaavat. Lue lisää laadunvarmistuksesta.

Julkisen tietovaraston karkeistukset

Tietovaraston tietojen karkeistukselle on kolme periaatteellista syytä:

  • Suojelusyyt: Sensitiivinen lajitieto karkeistetaan suojelusyistä. Lajitietokeskukselle on määritelty sensitiivisten lajien luettelo, jossa eri lajeille määritellään erilaisia salausasteita.
  • Aineiston luovuttajan käyttörajoitukset: Jäsenorganisaatiot saavat rajoittaa Lajitietokeskuksen julkiseen tietovarastoon jakamaansa aineistoa esimerkiksi tutkimuskarenssiajalla (uusin tieto karkeistetaan) tai luovuttaa muulla tavalla epätäsmällisempää tietoa julkisesti jaettavaksi.
  • Käyttäjän karkeistukset: Alkuperäinen havainnoja saa rajoittaa tietojensa jakamista julkisesti. Monet Lajitietokeskukseen liitetyt tietojärjestelmät tarjoavat käyttäjälle mahdollisuuden salata havaintojaan ja näitä salausmuuttujia kunnioitetaan kun tieto kopioidaan Lajitietokeskuksen julkiseen tietovarastoon.

Lue lisää karkeistusten toteutuksesta.

Havaintotieto ja muut tiedot kohtaavat tietovarastossa

Tietovarastossa havaintoihin liitetään taksonitietokannan tiedot, aineistojen kuvailutiedot (metadata) ja henkilöiden tietoja. Näin havaintoihin voidaan kohdistaa hakuja käyttäen myös liitettyjen resurssien ominaisuuksia. Esimerkiksi lajin ominaisuuksia ovat hallinnollinen asema ja eliöryhmä, joten näitä voidaan käyttää myös havaintohaun kriteereinä. Aineistojen kuvailutiedoissa määritellään mm. aneiston laatuluokitus, jonka avulla voi rajata havaintoja.

Lue lisää