AI, Deep Learning, Machine Learning, Data Science…. Det finnes mange begreper og mange bruker dem uten å vite hva begrepene egentlig innebærer. Bruken av begrepene virker noen ganger tilfeldig og man kan få en oppfattelse av at begrepene egentlig har samme betydning.
Valg av begrep drives ofte av hvilket begrep som har den største “hype”-effekten når det kommer til AI-feltet. Det kan være dumt fordi de fleste begreper har sin egen berettigelse. Det kan likevel være vanskelig å skille de fra hverandre, da de overlapper hverandre og spiller sammen.
Vårt søsterselskap i Danmark, Kapacity, har gjort en tolkning av noen av de mest vesentlige begrepene innenfor Data Science og Advanced Analytics. Her får du en oversikt over de vanligste begrepene:
Databaser og dataprosessering
For å kunne bruke data til å kunne ta informative beslutninger må de hentes, transformeres og lagres. Termene “databaser og dataprosessering” tar for seg innhenting, oppbevaring og manipulasjon av data. Det er også innenfor disse termene at man kan definere en av de klassiske business intelligence disiplinene, nemlig datavarehus.
Datavisualisering
Visualisering handler at data er ordnet som figurer og grafer. Ser man overordnet på det kan visualisering skje med to formål:
- Som en del av Visual Analytics hvor formålet er å bruke synet og den menneskelige kapasitet til å gjenkjenne mønstre i analysen av data
- Som visualisering av resultater, hvor formålet er å presentere resultater av analyser til andre på en enkelt og visuell måte
Statistikk
Klassisk statistikk dekker for eksempel over emner som stikkprøveteknikk, fordelingsteori, hypotestetest og design, samt analyse av eksperimenter. Denne typen metoder anvendes i stor grad innenfor akademisk forskning, men kan også benyttes til å undersøke forretningsrelaterte behov. Metodene benyttes som oftest når det ikke er mulig eller ønskelig å samle inn data, men når man derimot gjør en stikkprøve av disse dataene. Når man ikke har fullstendig informasjon (les: alle data), er man nødt til å benytte spesifikke metoder for å lage pålitelige og valide analyser.
Guide: Slik kommer du i gang med AI
Mønstergjenkjennelse
Som det ligger i navnet handler mønstergjenkjennelse om å gjenkjenne mønstre i data. Dette kan skje ved bruk av visualiseringsteknikker, matematiske teknikker eller statistiske teknikker. Ofte handler det om en kombinasjon av disse teknikkene.
Neurocomputing
Med et ønske om å kunne modellere den menneskelige hjerneaktiviteten har forskere utviklet matematiske modeller som skal stimulere naural aktivitet. Disse modellene (Naural Network) har vist seg å være anvendelige til å løse mange problemstillinger, på grunn av deres grad av fleksibilitet og kompleksitet. Modellene brukes blant annet innenfor Artificial Intelligence, Machine Learning og Deep Learning.
Artificial Intelligence (AI)
Formålet med AI er å få apparater til å oppfatte deres miljø/omverden og handle på måter som sikrer at et mål oppnås. Begrepet dekker derfor over ønsket om å skape systemer som i ytterste konsekvens er i stand til å tenke og agere selv. AI dekker både over en tilnærming, eller filosofi, og teknikker, slik som maskinlæring.
Les mer om AI og maskinlæring her.
Maskinlæring (ML)
Maskinlæring tar for seg en lang rekke av verktøy som benyttes til å lære sammenhenger i data. Gjennom mange iterasjoner av modellens parametere kan disse verktøyene brukes til å finne de beste løsningene/sammenhengene på dataproblemer. Vi snakker om maskinlæring eller ML når datamaskinen bruker algoritmer som kan behandle store datamengder, lære av den og dermed ta beslutninger. Dette kan løse oppgaver som klassifisering, mønstergjenkjenning og prognoser.
Så, hvilke problemer kan maskinlæring løse? Maskinlæringsalgoritmer kan i hovedsak brukes til to ting;
- Supervised learning: Å predikere hva som vil skje i fremtiden, gitt historiske data. Du deler dataene dine i test- og treningsdata, viser maskinen treningsdataene og forteller den hva den skal se etter. Så validerer du om datamaskinen har lært nok ved å vise testdataene og se hvilke resultater den gir.
- Unsupervised learning: Å finne mønster i data. Med unsupervised learning lar du datamaskinen fullstendig bedømme hvilke mønstre som er i dataene.
Les mer: Kan maskinlæring løse alle problemer?
Deep Learning
Deep learning er en spesifikk del av maskinlæring hvor man ved hjelp av multiple modeller som bygger på outputtet fra hverandre, kan lære veldig komplekse sammenhenger. Det er ofte avanserte neutrale nettverk med mange lag som informerer hverandre.
Data Mining
Data Mining er metoder for å jobbe med blant annet maskinlæringsteknikker for å frembringe viten og forretningsverdi. Det er derfor ikke en ren teknikk for dataanalyse, men det handler om mere spesifikt de prinsippene og prosesser som man skal jobbe med for å anvende maskinlæringsteknikkene for å skape forretningsverdi. Mest kjent er nok CRISP-DM (Cross-Industry Standard Process for Data Mining) som tar for seg Data Miningsprosessen fra start til slutt.
Data Lake
I sin enkleste betydning er en Data Lake et sted der alle rådata samles på sitt eget format. Et sted? Ja, for eksempel en egnet database eller et filsystem som er raskt og skalerbart nok til å ta imot data etter hvert som de skapes og blir tilgjengelige.
Hensikten er at den som skal bruke dataene ikke trenger å forholde seg til mange ulike datakilder, ulike plasseringer av data, ulike sikkerhetsmekanismer i hvert enkelt system og ulike datafangstteknologier. En av fordelene med Data Lake er at man ikke trenger å ha en klart definert datamodell på forhånd. En data lake kan være både skybasert, on-premise eller til og med en hybrid av de to.
Les mer: Data lake: Hva, hvordan og hvorfor
Guide: Slik kommer du i gang med AI
Mange selskaper er usikre på hvordan de kan komme i gang med AI. Å faktisk starte prosessen kan virke skremmende, for hva trenger du egentlig og hvor du skal starte? Det finnes store verdier i AI for alle virksomheter og organisasjoner. Spørsmålet er hvor og hvordan.