Datan laatu perustuu yhteisiin pelisääntöihin

Siirry sivun sisältöön

Satsaa liiketoimintaasi, paranna ydintiedon hallintaa

Mitkä data assetit ovat liiketoimintasi kannalta keskeisimpiä? Näiden datakokonaisuuksien avulla on mahdollista tehdä faktoihin pohjautuvia päätöksiä. Lisäksi ne auttavat liiketoimintoja ymmärtämään paremmin asiakkaitaan, kehittämään uusia tuotteita ja palveluja sekä parantamaan toiminnan tehokkuutta. 

Koska yritykset ovat entistä riippuvaisempia laadukkaasta datasta, on selvää, että yritysten dataa ja sen arvoa tulee myös vaalia, hallita ja johtaa systemaattisesti. On hyvin yksinkertaista keskittyä tekniseen toteutukseen, mutta kun aletaan puhua esimerkiksi käsitemalleista, tiedon omistajuudesta, rooleista ja vastuista sekä datan laadun hallinnasta, saatat huomata, että työsarkaa on edessä valtavasti. 

Jos tiedonhallintaa ja tiedon laatua ei kehitetä systemaattisesti, seuraukset näkyvät yrityksissä monella tavalla, kuten turhana työnä ja hämmennyksenä. Datan hallinta saattaa muistuttaa villiä länttä: Liiketoiminnan kannalta arvokkaimpia data-assetteja ja niiden master-järjestelmiä ei ole ensinkään tunnistettu ja päätetty tai datan luomiseen ei liity mitään kontrollipisteitä tai sääntöjä. Samaa dataa luodaan eri järjestelmissä omiin tarkoituksiin sen sijaan, että sitä välitettäisiin hallitusti eri järjestelmien välillä. Datassa voi olla puutteita, virheitä ja päällekkäisyyttä eikä sen laatua juuri hallita.

Ja mikä olennaisinta: datan heikko laatu hidastaa bisnestavoitteisiin pääsemistä.

Avaan nyt keinoja, joilla tuota usein monimutkaista datavyyhteä kannattaa lähteä setvimään. 

Selkeytä datan omistajuus ja vastuut

Datakyvykkyys ei ole vain IT-osaston, vaan koko organisaation asia. Teknologian ja arkkitehtuurin lisäksi tarvitaan selkeä toimintamalli sekä roolit ja vastuut datan hallinnointiin. 

Myös datalla pitää olla omistaja. Tämä taho tai henkilö vastaa muun muassa siitä, että kyseisen datan käyttö on sovittujen käytäntöjen mukaista ja että datan laatua parannetaan systemaattisesti.

Datan laadusta huolehtiva vastuuhenkilö tekee esimerkiksi näitä asioita:

  • määrittelee dataan liittyvää metadataa, liiketoiminnan terminologiaa ja sallittuja arvoja – yritys voi esimerkiksi luoda oman liiketoiminnan käsitteistön (business glossary), joka auttaa osaltaan luomaan yhtenäisen kielen ja termistön kaikkien käyttöön
  • määrittelee ja dokumentoi ohjeita ja standardeja datan hyödyntämiseen liittyen 
  • johtaa datan laadun kehittämistä eli ottaa kantaa ja tekee päätöksiä tunnistettuihin datan laadullisiin ongelmiin etsien parhaita ratkaisuja yhdessä muiden asiantuntijoiden kanssa sekä
  • näyttää itse hyvää esimerkkiä ja vastaa siitä, että sovitun data governance -mallin mukaisia parhaita käytäntöjä noudatetaan projekteista toiseen.

Tarkastele laatua kuudesta kulmasta

Bisneskriittisen datan laatua on hyvä arvioida useista suunnista. Puhutaan myös datan laadun dimensioista. Datan laatua voidaan monitoroida ja mitata esimerkiksi data-alustassa tai erillisessä, siihen tarkoitetussa järjestelmässään. 

Alla esitetyt kuusi ulottuvuutta auttavat, kun haluat ylipäänsä nostaa datan laadun merkitystä esiin sekä parantaa sitä systemaattisesti:

  1. Kattavuus (completeness): Vertaa asianmukaisesti täytettyjen tietueiden ja kenttien määrää tietueiden yhteismäärään. Onko kyseinen tieto täytetty riittävän kattavasti? Esimerkki: Järjestelmästä löytyy 1000 erilaista tuotetta, mutta kuinka monen kohdalla puuttuu tieto takuuajasta?
  2. Yksilöllisyys (uniqueness): Selvitä duplikaattien eli päällekkäisten tietojen määrä. Esimerkki: Löytyykö sama asiakas virheellisesti eri asiakastunnuksilla, ts. onko sama asiakas luotu useamman kerran?
  3. Oikea-aikaisuus (timeliness): Kun siirretään tietoa järjestelmästä toiseen, voidaan laskea, mikä osuus datasta on syystä tai toisesta jäänyt matkalle. Esimerkki: Rivejä olisi pitänyt tulla perille X kappaletta, mutta Y riviä ei ole siirtynyt onnistuneesti.
  4. Vaatimusten mukaisuus (validity): Varmista, miten hyvin data noudattaa sovittuja määrittelyjä (datan tyyppi, syntaksi, muoto, vaihteluväli ja sovitut koodit). Esimerkki: Postinumeroilla on tietyt sovitut arvot, mutta löytyykö järjestelmästä virheellisesti syötettyjä arvoja?
  5. Tarkkuus (accuracy): Kiinnitä huomiota siihen, kuinka kattavasti data vastaa tosielämän arvoa tai tapahtumaa. Esimerkki: Onko tietyn asiakkaan osoitetieto todella oikea?
  6. Johdonmukaisuus (consistency): Etsi ne järjestelmäkohtaiset erot, joita datan muodoissa on, jotta tietoa voi käyttää yhtenevästi. Esimerkki: Mikä on puhelinnumeron kirjoitusmuoto eri järjestelmissä?

Tee datan laadun parantamisesta jatkuva tapa

Datan laadun kehittäminen on tavoitteellista työtä. Luo konkreettisia tavoitteita ja hahmota, mikä on ambitiotaso datan laadun ja sen mittaamisen suhteen. Jokaisen, joka työskentelee organisaatiossa datan kanssa, olisi hyvä ymmärtää tietyt periaatteet – esimerkiksi mitä tietoja on välttämätöntä kirjata, kun luodaan uutta dataa. 

Tämä on tärkeää siksi, että jos yksi ihminen toimii välinpitämättömästi datan laadun suhteen, sillä voi todennäköisesti olla vaikutuksia muualla. Teknologia voi toki ohjata esimerkiksi järjestelmäkirjauksissa, kuten numerotietueiden sallitussa vaihteluvälissä, mutta oleellista on tehdä datan laadusta kaikkien yhteinen agenda ja datan hallinnasta systemaattista.

Valitse taistelusi: aivan kaikkea et varmasti voi kontrolloida. Tunnista, mikä data on sellaista, että sen laatua on erityisen tärkeää mitata. Tämän jälkeen voit luoda liiketoiminnan laatusäännöt kyseiselle datalle ja määritellä niitä aina attribuuttitasolla. Laatusääntöjen määrittelyssä voit hyödyntää aiemmin listaamiani laadun ulottuvuuksia.

Tiedon laadun mittaamisessa puhutaan usein kontrollipisteistä ja monitoroinnista. Kontrollipisteet tähtäävät siihen, että data lähtisi jo lähdejärjestelmistä laadukkaana. Tätä varten on mahdollista luoda erilaisia kontrolleja ja tarkistuksia mahdollisimman lähelle sitä lähdettä, jossa uutta dataa luodaan.

Kun datan laatusäännöt ja raja-arvot on identifioitu, voidaan data-alustalle puolestaan tuoda tiedon laadun monitorointia. Tämä tarkoittaa sitä, että datan laatua mitataan sovittujen laatusääntöjen ja aiemmin kuvattujen laatudimensioiden mukaisesti. Voit visualisoida monitoroinnin tulokset raportointityökalujen avulla. Lisäksi voit asettaa tarvittavia hälytyksiä ja ilmoituksia tilanteisiin, joissa datan laatu ei täytä sille asetettuja laatuvaatimuksia ja raja-arvoja.  

Datan omistajat tai muut vastuutahot ottavat kantaa näihin laatupoikkeamiin ja päättävät, miten niiden suhteen pitää toimia. Mikä tieto on niin tärkeää, että virhe on korjattava heti? Milloin riittää tilanteen seuraaminen, entä milloin kyseessä ei ole ongelma lainkaan?

Datan laadun parantaminen ei ehkä kuulosta ihan helpolta urakalta. Toisaalta datan laadulliset ongelmat kuluttavat hyvin paljon työaikaa, aiheuttavat sekaannusta ja tuovat konkreettisia kustannuksia organisaatioille. Ponnistelu siis kannattaa. Tulokset näkyvät kilpailuetuna, kun saat laadukkaan datan nykyistä paremmin hyötykäyttöön.

→ Lue lisää data- ja analytiikkapalveluistamme!

Lisää aiheeseen liittyvää