Izvedba virtualizacije

Virtualizacijo podatkov lahko izvedemo na več načinov, od katerih so najbolj poznani sama virtualizacija, za katero se uporablja tudi sinonimi abstrakcija, federacija in integracija. Čeprav gre za podobne stvari, se med seboj razlikujejo, res pa je, da je definicija posameznih pojmov odvisna tudi od ponudnikov tehnologij in od njihovega razumevanja virtualizacije. V splošnem se vsi omenjeni načini virtualizacije nanašajo na to, da dostavijo podatke iz enega ali več različnih virov, sama fizična struktura podatkov pa je skrita pred uporabniki. Ti vedo le, kam morajo oditi po podatke, vse ostalo je prepuščeno izvedbi virtualizacije.

Maja Ferle / MonitorPro

Federacija podatkov pomeni, da podatki izvirajo iz več različnih virov, uporabniki pa jih vse vidijo kot enotno zbirko. Viri podatkov so lahko izvedeni v različnih, med seboj neodvisnih tehnologijah in v različnih podatkovnih strukturah. Rezultati so predstavljeni v enotnem uporabniškem vmesniku, ki lahko zagotovi tudi določeno stopnjo čiščenja in obogatenja podatkov. Podatki se uporabnikom dostavijo na zahtevo, kar pomeni takoj oziroma takrat, kadar jih potrebujejo. Pri tem se podatki ne prepišejo fizično niti se ne shranijo, ampak ostanejo na svoji izvirni lokaciji v izvirni obliki.

 

Največji izziv federacije je, kako poenotiti tehnološko različne izvedbe podatkovnih virov, ki sodelujejo v federaciji. Značilen problem je, kako izvesti združeno poizvedbo iz različnih virov, torej kako povezati poizvedbo v dve tabeli, ki sta vsaka v svojem viru. Praviloma je to časovno zelo zahtevna operacija, saj v takem primeru ni mogoče uporabiti optimizatorja poizvedb posamezne zbirke podatkov, ki predstavlja vir podatkov. Ena od mogočih rešitev je prepis podatkov iz vsakega vira na neko skupno lokacijo, kjer se potem izvedeta združitev in poizvedba. Vendar bi s tem izgubili ravno tisto prednost virtualizacije, ki se nanaša na hiter dostop do podatkov brez fizičnega prepisovanja. Sodobnejše tehnologije ta problem rešujejo na drugačen način, na primer tako, da združijo podatke v pomnilniku, preden dostavijo rezultat, kar je mnogo učinkovitejše od fizičnega prepisovanja podatkov.

 

Razjasnimo še izraz integracija podatkov. Ta pomeni, da podatke iz različnih virov združimo v enotno podatkovno strukturo. Da to naredimo, jih moramo povezati, po potrebi pretransformirati, očistiti, obogatiti in ponuditi kot celovito zbirko podatkov. Ni predpisano, na kakšen način se to zgodi, kar pomeni, da lahko podatke prepišemo ob pomoči tradicionalnih procesov ETL, lahko pa jih tudi ponudimo na virtualiziran način. V tem drugem primeru sploh ni nujno potrebno, da gredo prek procesa ETL, ampak so lahko implementirani ob pomoči pogledov v relacijskih zbirkah podatkov ali s federacijo podatkov oziroma na način, pri katerem izkoristimo virtualizacijo podatkov.

 

V splošnem sama virtualizacija podatkov ne pomeni nujno tudi integracije. Na primer, virtualiziramo lahko le en vir podatkov, brez združevanja več različnih virov. Virtualizacija podatkov pa lahko vsebuje tudi federacijo in integracijo. Najbolj naravno je uporabiti virtualizacijo takrat, kadar so izvorni podatki že ob izvoru na neki način virtualizirani, na primer kadar so v oblaku ali v storitveno usmerjeni arhitekturi. Lahko pa jo seveda uporabimo tudi, kadar so podatki shranjeni v zbirkah podatkov ali v drugih podatkovnih virih.

 Z verigo sreče do novih uspehov

Družba Unistar PRO letos praznuje 25. obletnico. Direktor Miran Boštic ve, da upravlja z znanjem in sposobnostmi več kot sto strokovnjakov, zato bo podjetje usmeril na zahtevnejša zahodna in severna tržišča.

Preberi celoten intervju.