Gå til hovedsiden

Hvordan få verdi ut av en satsning på Data Science?

Dette er del 2 av 2 om Data Science og Advanced Analytics, hvor jeg vil gå gjennom de grunnleggende forutsetningene jeg anser at du som kunde bør forstå for å få verdi ut av en satsning på Data Science.

Hvordan få verdi ut av en satsning på Data Science?

Kjenn og forbered dataene dine

En forutsetning for at du skal få verdifull innsikt ut av dataene dine er at du fullt ut kjenner til og forstår den dataen du ønsker å analysere. Qliks produkter er godt egnet for dette da de med sin assosiative modell hjelper både sluttbrukere og utviklere med å sette seg inn i dataene sine. Deres Advanced Analytics Integration kan også hjelpe utviklere og data scientists med å teste prototyper og modeller raskere mot et begrenset datasett i eksisterende Qlik-applikasjoner.

Ved å bli bedre kjent med dataene dine, vil du også kunne oppdage eventuelle datakvalitetsproblemer og den datavaskingen som må gjøres. Å kunne preppe dataene dine er en helt grunnleggende kjernekomponent for å få gode resultater innen Data Science og Advanced Analytics. Dette er noe de fleste BI-konsulenter er svært dyktige på, noe som igjen gjør at BI-konsulenter naturlig passer inn i data science-prosjekter.

Hvis du bruker statistiske modeller i en database med manglende datakvalitet, kan det føre til utrolig skjeve og feilaktige resultater. Dette er noe som svært sjelden kommuniseres med kunder ved innsalg av data science-prosjekter.

Ingen verktøy kan løse alle problemer

Når du har tillit til dine underliggende data, bør du velge et verktøy for å implementere data science-prosjektet ditt. Verktøyet i seg selv er ikke det viktige, velg det verktøyet som du har best kunnskap om og kjennskap til. Advanced Analytics, spesielt i relasjon med Qlik, benytter seg som regel av open source-løsninger som R eller Python.

Tenk også på at de fleste data science-verktøy og databaser som regel er designet for å brukes av analytikere, eksperter og data scientists i et “laboratoriemiljø” med tilrettelagt data. De er som regel ikke tilpasset den brede massen og en virkelighet med mangel på datakvalitet. Ved større datamengder kan analysen som regel heller ikke gjøres i sanntid, men må preppes på forhånd for å deretter presenteres i et BI-verktøy som Qlik Sense. Det er i dag ingen verktøy som automatiserer dette. Det kreves både verktøy, mennesker og kunnskap for at det skal bli bra.

Forstå algoritmen

Denne typen dyp analyse produserer alltid statistikk gjennom statistiske regler. I de aller fleste tilfeller benyttes gamle lovbestemte statistiske algoritmer som har eksistert siden 1960-tallet, men for å få et godt resultat må du ha kunnskap om algoritmene som brukes. Du trenger ikke å ha en doktorgrad i statistikk eller å være professor i matematikk, men det er viktig at du i stor grad forstår hvordan en algoritme fungerer, parameterne som påvirker den og hvorfor den gir et gitt resultat.

Uten denne forståelsen kan man få svært feil og villende innsikt. Data science blir aldri bedre enn den algoritmen som brukes. Med det sagt så må jeg også si at man i de første prosjektene kan legge mindre vekt på hvilken algoritme som brukes, men datamodelleringen av datasettet og kvaliteten på dataen er betydelig viktigere.

Avslutningsvis

For å oppsummere åpner Data Science og Advanced Analytics opp helt nye muligheter i forhold til tradisjonell beslutningsstøtte, men det stiller enda større krav til kunden. Tilgang til kompetanse innen data science er også svært vanskelig å finne. For eksempel skriver Gartner at den typen kompetanse er svært etterspurt og til og med svært sjelden.

Mitt råd er derfor å starte denne typen prosjekt med de personene i din organisasjon som har oversikt over deres underliggende data, og som er dyktige i å transformere og preppe den – det vil si deres BI-organisasjon.

Les også:Del 1 – Hva er Data science og Advanced analytics?

Hvordan benytte analyse, business intelligence og maskinlæring i dine IT-prosjekter? Last ned gratis guide her:

Last ned guide