O PODATKOVNI ZBIRKI

Odkar je Scopoli daljnega leta 1763 objavil prvi seznam žuželk in Freyer leta 1842 prvi seznam vretenčarjev, je nakopičeno znanje o posameznih skupinah organizmov daleč preseglo zmožnosti posameznika in način zbiranja podatkov brez pomoči računalnika.

Zbiranje podatkov in nadaljnje razširjanje podatkov o rastlinstvu in živalstvu Slovenije je bil eden od temeljnih razlogov ustanovitve CKFF. Sprva smo v podatkovno zbirko organizirali dostopne podatke o kačjih pastirjih in dvoživkah, kmalu zatem pa tudi podatke o rastlinah in večini živalskih skupin. Ocenili smo, da je na voljo ogromno podatkov, ki bi jih bilo treba digitalizirati, vsekakor za več desetletij dela posameznika. Nismo se motili. V zadnjih dvajsetih letih se je v naši relacijski podatkovni zbirki nakopičilo več kot 1.600.000 podatkov. Zbirko ves čas nadgrajujemo in jo dopolnjujemo z različnimi tabelami, ki omogočajo vnose dodatnih informacij. Naša želja je, da bi bili na enem mestu zbrani podatki o vrstni pestrosti Slovenije.

Podatkovno zbirko CKFF smo taksonomsko, vsaj zaenkrat, omejili tako, da aktivno ne zbiramo podatkov o mikroorganizmih, glivah in algah ter morskih organizmih. Glede na ostale obstoječe podatkovne zbirke pa dodatno ne zbiramo novejših podatkov o vrstah divjadi in vseh vrstah ptic. Tudi pri teh skupinah pa se ne omejujemo pri vnosu podatkov iz starejših literaturnih virov. Podatkovna zbirka je prostorsko omejena na ozemlje Slovenije. Zbiranje podatkov pa temelji na slovenski zakonodaji, saj nad odkritji (»tudi tistimi v naravi«) ni avtorskih pravic (9. člen Zakona o avtorskih in sorodnih pravicah (ZASP-UPB3).

En podatek je zapis o eni vrsti na določeni lokaciji na določen dan, ki jo je zabeležila ena ali več oseb. Opazovanje iste vrste že naslednji dan je tako nov podatek.

Iz podatkov taksonomsko urejenih skupin je možno narediti seznam vrst za Slovenijo z enim samim klikom, v tem primeru je podatek za vrsto za Slovenijo popolnoma zadosten. Z vidika ekoloških raziskav, pa je podatek o vrsti, ki je naveden le za Slovenijo, popolnoma neuporaben. Zato je bilo ključno podatke v podatkovni zbirki organizirati na način, da lahko vanjo vnašamo podatke za različne skupine (flora, favna), podatke zbrane na različen način (npr. prelet, gnezdenje, rastišče, povoz na cesti, razmnoževanje itn.) kot tudi različno prostorsko natančne podatke.

Vir podatkov

V podatkovni zbirki CKFF so digitalizirani in združeni javno dostopni in zasebni podatki iz več virov. Dodatno so v podatkovno zbirko vključeni tudi javni podatki (večinoma financirani iz javnih sredstev), ki pa niso nujno enostavno javno dostopni.

Podatke nam posredujejo številni posamezniki, društva in ustanove, poleg teh pa aktivno zbiramo tudi ostale dostopne podatke.

Lastni podatki
Lastni podatki so podatki zaposlenih CKFF in zunanjih sodelavcev CKFF, ki so bili zbrani v okviru projektov CKFF.
Osebni podatki
Osebni podatki so podatki zunanjih sodelavcev CKFF ali podatki, ki jih posredujejo različni posamezniki. Številni med njimi so člani strokovnih društev, ki se ukvarjajo z rastlinstvom ali posameznimi skupinami živali (npr. Botanično društvo Slovenije, Slovensko odonatološko društvo, Herpetološko društvo - Societas herpetologica Slovenica, Društvo za proučevanje in ohranjanje metuljev Slovenije, Slovensko društvo za proučevanje in varstvo netopirjev itn.).
Literaturni podatki
Glede na izvor podatkov razlikujemo med različnimi viri, pri čemer pa ne razlikujemo med znanstvenimi objavami v recenziranih slovenskih ali mednarodnih revijah, objavah v poljudnih revijah brez recenzije ali t.i. sivo literaturo.

  • PRIMARNI VIRI: jasno je naveden kraj najdbe in pogosto tudi leto ali celo datum vzorčenja
  • SEKUNDARNI VIRI: jasno je naveden izvor podatka
  • DRUGI VIRI: izvor podatka ni jasno razviden
Neobjavljene študije (t.i. siva literatura) so se kot vir podatkov izkazale za izredno pomembne, saj floristični in favnistični podatki iz številnih raziskav pogosto nikoli niso objavljeni. Zato je upoštevanje sive literature za izdelavo seznamov vrst nekega območja zelo pomemben vir natančnih informacij. Tovrstne študije običajno vsebujejo obsežne informacije o vseh registriranih vrstah nekega območja in ne samo o redkih vrstah, ki so navadno predmet objavljenih raziskav. Slednje je uporabljeno tudi v številnih publikacijah npr. Gradiva za floro Slovenije (Jogan in sod. 2001). Posamezni uporabniki podatkov, pa se potem sami odločijo za (ne)uporabo teh podatkov oziroma jih kritično ovrednotijo, kot je bilo to npr. storjeno v Atlasu dnevnih metuljev Slovenije (Verovnik in sod. 2012).
Fizične zbirke
Podatki pridobljeni z digitalizacijo fizičnih zbirk (npr. Ljubljanski univerzitetni herbarij, Zbirka dnevnih metuljev Prirodoslovnega muzeja Slovenije) predstavljajo manj kot 5 % podatkov, ki so doslej zbrani v podatkovni zbirki CKFF.
Podatki v digitalni obliki
V zadnjih letih je potrebno v okviru projektov, ki jih večinoma naroča Ministrstvo za okolje in prostor, zbrane podatke oddati organizirane v digitalni oblike. Kljub temu zaenkrat v Sloveniji nimamo predpisanih standardov in je tudi takšne podatke pogosto potrebno še dodatno urediti.
Digitalizacija - dodana vrednost podatkov
Informacijo zapisano v literaturi spremenimo v podatek - podatke digitaliziramo v obliko, da jih lahko obdelujemo. Vsem podatkom z vnosom v podatkovno zbirko CKFF in prostorsko umestitvijo (digitalizacija) dodamo vrednost, saj jih je šele potem mogoče nadalje uporabiti, jih analizirati in interpretirati na številne načine in za različne namene.

Način organizacije podatkov v podatkovni zbirki CKFF je nam lasten in med drugim predstavlja tudi odgovornost in interpretacijo posameznega vnašalca. Napačni interpretaciji se izogibamo z dodatnim vnosom originalnega zapisa podatka in tako povečujemo natančnost in preverjanje vnosa.

ORGANIZACIJA IN VZDRŽEVANJE PODATKOVNE ZBIRKE

Taksonomska točnost podatka
Vnašalec podatka v podatkovno zbirko ne sodi o pristnosti podatka; ne išče sinonimov ali trenutno veljavnih imen. Taksonomija se spreminja, zato je vsak podatek vnesen pod tistim znanstvenim imenom, kot je bil objavljen. V podatkovno zbirko tako vnesemo vsa objavljena imena, pri nas zaposleni strokovnjaki in zunanji sodelavci CKFF, strokovnjaki za posamezne skupine, pa taksonomsko vzdržujejo le "svoje" skupine. Zato npr. za floro ali vretenčarje za veliko večino podatkov starejšega datuma vemo, kateri vrsti pripada, za podatke nekaterih skupin žuželk pa tega ne moremo vedeti, saj za številne v Sloveniji ni specializiranih strokovnjakov.
Prostorska točnost podatka - prostorska natančnost lokalitet
Opisi najdišč (lokalitet) favne in flore so v literaturi zapisani z različno natančnostjo, od večjih območij pa vse do točnega zapisa koordinat. Predvsem v starejših literaturnih virih so pogosto navedeni podatki o vrstah, ki so vezani na bližnji manjši ali večji kraj, zato je pri geokodiranju teh podatkov nujna določena stopnja poenostavitve in poenotenja. Slednje je odvisno tako od natančnosti samega opisa najdišča kot od dejanskega stanja v naravi. Tako npr. najdišče "gozd pri kmetiji Kočevar" lahko natančno opredelimo le v primeru zapisa koordinat, "mlako pri kmetiji Kočevar" pa lahko kljub na videz enako "slabemu" zapisu opredelimo natančneje, če po digitalnih podlagah (običajno digitalni ortofoto posnetek - DOF ali temeljni topografski načrt, list vode) ugotovimo, da je pri kmetiji Kočevar le ena sama mlaka.

Z namenom določitve prostorske natančnosti podatka smo razvili 9-stopenjsko lestvico prostorske natančnosti, ki smo jo prvič predstavili v Raziskavi razširjenosti evropsko pomembnih vrst v Sloveniji (Kryštufek in sod. 2001). Vsaka lokaliteta je tako opredeljena z enim od razredov prostorske natančnosti.

Tabela 1. Kode natančnosti lokalitet v podatkovni zbirki CKFF.
Stopnja natančnostiOpis
0Slovenija
1Regija; območje > 130 km2
2Kvadrati mreže srednjeevropsega kartiranja favne (UTM) in flore (MTB)
3Večji kraji in območja; območje med 6 in 130 km2 (npr. doline srednje velikih rek...,)
4Naselja GURS
5Toponimi brez relacije (npr. gore, hribi, doline potokov...)
6Prostorsko natančnejši toponim (npr. zaselki, vrhovi gora, okolica kmetije...)
7Lokalitete z relacijami; prostorsko natančni toponimi, GIS; 1:25.000
81:5.000; GIS


Pri lokalitetah s stopnjami natančnosti 7 in 8 je lokacija določena s pomočjo karte (DOF) ali GPS napravo. Te natančnosti so običajno podatki iz zadnjih let, ko so pri podatku zapisane tudi koordinate ali pa npr. tudi stari podatki o jamski favni, če je uporabljeno ime jame, ki jo lahko še danes prostorsko natančno določimo. V razred s stopnjo natančnosti 6 uvrščamo predvsem podatke, ko lahko iz opisa najdišča dokaj natančno sklepamo na morebitno dejansko najdišče (npr. okolica kmetije, okolica železniške postaje, vrh gore ipd.).

S stopnjo natančnosti 5 običajno opredelimo vse tiste podatke, ki imajo v zapisu naveden prostorski toponim. Toponim je zemljepisni pojem, ki po definiciji predstavlja lastno ime za topografski objekt in je splošno sprejeti izraz za zemljepisna imena. Vsi toponimi so zapisani na eni izmed kartografskih podlag. Okolico toponima lahko na kartah glede na sosednje vsaj približno omejimo. Velik del lokalitet vezanih le na toponim so hribi in gore. Na toponime s stopnjo natančnosti 5 so vezani tudi podatki, ki so na prvi pogled zapisani bolj natančno, a bi dejansko uvrstitev v razred z višjo stopnjo natančnosti (6) pomenila večjo napako. Koordinato toponima s stopnjo natančnosti 5 smo opredelili v osrednjem delu toponima in je kot taka relevantna predvsem za prikaz podatkov. Realno ležijo točna najdišča nekje v bližini.

Večina starejših podatkov je navedena zgolj z imenom kraja ali zaselka. Slednje uvrščamo v razred s stopnjo natančnosti 5, vse kraje ne glede na velikost pa uvrščamo v svoj razred s stopnjo natančnosti 4. Koordinate smo privzeli iz podatkov GURS centroida naselij, ki pa ni enak centru naselja. Podobno kot za razred s stopnjo natančnosti 5 velja, da je koordinata zgolj informativnega značaja in služi predvsem kartografskim prikazom. Kot naselja smo tako geokodirali številne podatke z opisi brez referenčne točke, npr. "pri hiši ob koncu asfalta", pa tudi na videz natančnejše podatke brez omembe samega najdišča, npr. "500 m S od vasi". V danem primeru lahko sicer predvidevamo približno lokacijo najdbe vrste, vendar pa ne moremo vedeti ali gre za oddaljenost od centra vasi, roba vasi, zadnje hiše, cestne table, prav tako ne vemo, kako je bila določena razdalja, v ravni liniji ali po cesti, ocenjena na terenu ali po zemljevidu. Tudi zapisi smeri so pogosto posplošeni in zajemajo nekaj deset kotnih stopinj širok kot.

V Sloveniji je pogosto pri natančnejših podatkih zapisan tudi kvadrat mreže kartiranja favne ali flore. Danes lahko z GIS orodji za vsako točko v naravi določimo, v katero celico poljubne mreže spada. Pri starejših podatkih pa so to opredeljevali po kartah manjše natančnosti s slabo vrisanimi mrežami, zato uvrstitve v kvadrat ne upoštevamo, če je zapisano tudi natančnejše najdišče. Podatki, ki so v literaturi podani zgolj z UTM kvadrati (večinoma favna) ali četrtinkami MTB kvadrantov (flora) so uvrščeni v svoj razred s stopnjo natančnosti (2). Podatki običajno izvirajo iz preglednih virov (npr. Jogan in sod. 2001), kjer so bile objavljene karte razširjenosti vrst. Pri digitalizaciji teh podatkov upoštevamo ime polja.

V razreda s stopnjama natančnosti 1 in 3 so uvrščene lokalitete, ki pokrivajo večja območja. Meja je okoli 130 km2, tako ima celo Ljubljansko polje stopnjo natančnosti 1, Ljubljana z okolico pa stopnjo natančnosti 3.

UPORABNOST PODATKOVNE ZBIRKE

Uporabnost podatkov je neposredno povezana z njihovo prostorsko natančnostjo. Prostorsko točni podatki so uporabni za analize manjših območjih, tisti manj točni podatki pa za regionalne analize. Prostorsko najmanj točne navedbe so vedno uporabne (vsaj) za izdelavo seznamov vrst Slovenije.

Atlas faunae et florae Sloveniae
Atlasi razširjenosti vrst so verjetno najbolj logična oblika uporabnosti podatkovne zbirke, za izdajo tovrstnih del pa je treba digitalizirati čim večje število podatkov in pregledati čim več literature. Glede na kvaliteto podatkov so potem v nadaljevanju možne različne analize razširjenosti vrst, obdobja njihovega pojavljanja itn...

Doslej smo iz podatkov v podatkovni zbirki CKFF založili tri atlase (Atlas dnevnih metuljev (Lepidoptera: Rhopalocera) Slovenije (2012), Atlas netopirjev (Chiroptera) Slovenije (2009) ter Atlas kačjih pastirjev (Odonata) Slovenije (1997)) in Gradivo za atlas flore Slovenije (2001) ter preliminarno analizo Razširjenosti plazilcev v Sloveniji (2009).
Nacionalni seznami vrst
V zadnjih letih smo aktivno sodelovali pri pripravi seznama metuljčkov (Microlepidoptera) (Lesar & Govedič 2010) ter pajkov (Araneae) Slovenije (Kuntner & Kostanjšek 2014).

Vendar pa podatkovna zbirka ne omogoča le izdelave enostavnih seznamov vrst, temveč lahko podatke analiziramo tudi z drugih vidikov, npr. naraščanje poznavanja števila vrst skozi daljše obdobje.

Slika 1: Histogram naraščanja števila objavljenih vrst metuljčkov Slovenije po desetletjih.
Podpora raziskavam
Na nas se pogosto obrnejo raziskovalci, ki se ukvarjajo s točno določeno vrsto. Nekaterim pripravimo zgolj karte razširjenosti, drugi podatke uporabijo drugače, saj so iz številnih zbranih podatkov možne tudi kompleksnejše analize.

Podpora podatkov iz naše podatkovne zbirke je ključna povsod, kjer raziskave kombinirajo z obstoječim znanjem. Prva takšna raziskava v Sloveniji je bila izvedena leta 2001 - Raziskava razširjenosti evropsko pomembnih vrst v Sloveniji - vodil jo je Prirodoslovni muzej Slovenije, vsi zbrani in oddani podatki pa so bili najprej organizirani v naši podatkovni zbirki. Prav tako so bili podatki, ki so bili kasneje zbrani kot Strokovne podlage za opredelitev Natura 2000 območij za dvoživke, kačje pastirje in netopirje, najprej organizirani v naši podatkovni zbirki.
Posredovanje podatkov
Javne, javno dostopne in objavljene podatke ter podatke katerih zbiranje je bilo financirano iz javnih sredstev lahko posredujemo za različne namene. Najpogosteje so ti podatki uporabljeni za različna mnenja o posegih, pri umeščanju objektov v prostor. Naš cilj je, da bi te podatke lahko uporabljali vsi pod istimi pogoji. Podatki so uporabni za lokalne, regionalne in nacionalne analize.
S porabo približno 30 človek/let delovnega časa smo v Centru za kartografijo favne in flore ustvarili podatkovno zbirko o razširjenosti nad 27.000 rastlinskih in živalskih vrst (65.767 imen), ki obsega 1.941.620 podatkov in 8.441 virov na 76.913 lokalitetah.

164.321 fotografij (3.824 vrst in 296 habitatnih tipov na 25.521 lokalitetah) je prispevalo 1.059 fotografov.

V sodelovanju s številnimi partnerji in posamezniki ter ob uporabi nekaterih javnih podatkov smo jo povezali v uporabniški vmesnik - BioPortal. Do nekaterih delov BioPortala lahko prosto dostopate.