Berlingske Business
17:44Business Live vender tilbage tirsdag

Big data: Buzzword eller big deal?

Big data
Få begreber er blevet et buzzword som big data. Men hvad dækker big data egentlig over, og hvordan kommer du i gang? Vi forsøger at besvare spørgsmålene og ser på, om det i det hele taget giver mening at gå efter at blive en big data virksomhed.

Få begreber er blevet et buzzword som big data. Men hvad dækker big data egentlig over, og hvordan kommer du i gang? Vi forsøger at besvare spørgsmålene og ser på, om det i det hele taget giver mening at gå efter at blive en big data virksomhed.

Du er allerede blevet tudet ørerne fulde om big data. Indsamler og bruger du ikke de enorme mængder data, som din virksomhed uden tvivl skaber, kan du lige så godt dreje nøglen om. For ellers står dine konkurrenter klar.

Men er det big data, når du analyserer trafikken på dit website? Bliver det til big data, når du kombinerer det med data fra dit CRM-system? Og er det virkelig big data, når Spotify eller Netflix giver bud på musik eller film, du kan lide?

Lad os først forsøge at definere big data. Vi har talt med to dataspecialister, som har arbejdet med big data i mange år, og som har et bud på, hvad der ligger bag begrebet.

pix-Skybrud

»Det er svært at sætte grænsen for, hvornår noget er big data, og hvornår det ikke er. Men en tommelfingerregel er, at hvis du er usikker, så er det formentlig ikke big data,« siger Angel Diego Cuñado Alonso, der er Machine Learning Engineer hos danske Tradeshift, og fortsætter:

»Big data er en løsning, når de traditionelle metoder til at indsamle, opbevare og behandle data ikke længere slår til, fordi datamængden simpelthen er blevet for stor. Det kan f.eks. være, når der er rigtig mange forespørgsler, når datamængden strækker sig over flere datasæt eller når værdierne ikke længere blot er numeriske værdier.«

Nogenlunde samme definition kommer fra Johannes Scheibe, der er Data Scientist hos Ebay og har en master i Machine Learning and Computational Neuroscience. Han peger på fire karakteristika, der kendetegner big data.

DAVOS-MEETING/

High volume, high variety, high variability og high veracity. Husk også, at din virksomheds datasikkerhed er afgørende, når virksomheder skal håndtere store datamængder. Med nye sikkerhedsmodeller kan man højne datakvaliteten og gøre det lettere at bruge store datamængder på tværs af organisationer, uden at man går på kompromis med fortroligheden. Læs mere om hvordan du krypterer big data her.

Store eller små data - who cares?

Angel Diego Cuñado Alonso og Johannes Scheibe er enige om, at det ikke giver mening at klistre mærkatet big data på enhver indsamling af data. Og big data skal i virkeligheden mere ses som en udfordring i indsamlingen af data. Et udfordrende stadie - så at gå efter at blive en big data-virksomhed for begrebets skyld giver ingen mening, mener Johannes Scheibe.

»Det betyder ikke noget, om det er store eller små data. Det betyder noget, om du kan få insights ud af dit datasæt, som giver mening for dit firma. Hvis det viser sig, at du har big data, handler det kun om at finde ud af, hvordan du får noget menin gsfyldt ud af dine data, og det er en ren teknisk udfordring. Det giver ingen mening at melde ud på strategisk niveau, at nu skal vi være en big data-virksomhed. Enten har du big data - og så kan du forsøge at bruge dem - eller også har du ikke,« siger Johannes Scheibe.

Fordi vi i høj grad arbejder i skyen, og fordi flere og flere enheder bliver koblet til skyen via internet of things, står mange virksomheder dog i en situation, hvor de indsamler mere data. Om de vil eller ej. Og data har samtidig ændret sig og er blevet mere komplekse.

Technology

»I gamle dage havde du en database - typisk på en lokal maskine - med rækker og kolonner, og her gemte du talværdier eller ord og lavede forespørgsler. I dag gemmer vi tekstinput, billeder, videoer, dokumenter m.m., og vi alligevel forventer vi resultater i realtid. Derfor er datamængden steget dramatisk, og i de fleste tilfælde fungerer de gamle metoder ikke længere,« siger Angel Diego Cuñado Alonso.

Selv små datamængder skabe helt nye forretningsområder og ikke kun big data – læs her hvordan.

Start med at pege på de insights du har brug for

Går du med big data-tanker, gælder det i virkeligheden om at vende tingene på hovedet. Hvad har vi brug for at vide? For der er ingen grund til at indsamle og strukturere data, hvis de ikke skaber værdi for virksomheden.

»Data er aldrig perfekte. Jeg er machine learning-ingeniør, og jeg bruger måske 80 procent af min tid på at forberede data og kæde dem sammen. Og så bruger jeg måske 20 procent på at lave algoritmer,« siger Angel

Diego Cuñado Alonso og giver et eksempel. Du har måske samlet data i fem år, men finder så ud af, at du mangler en vardata sciabel i dit datagrundlag, før du kan konkludere noget. Så hvad gør du med den data, du allerede har indsamlet? Smider du 5 års data væk, eller forsøger du at gætte dig frem til en værdi for variablerne i de fem år, hvor du ikke har indsamlet? Uanset hvad, er det et stort arbejde at “aligne” data, så den er konsekvent. Verden er omskiftelig, og dine behov ændrer sig hele tiden, men det hjælper at have et klart mål med din indsamling fra starten.

29BUSData5-161222.jpg

»Der er ingen grund til at finde løsninger på problemer, som vi endnu ikke har. Det vil blot tilføje unødvendig kompleksitet. Først har et firma brug for lægge sig fast på sin vision. Hvad vil kunderne have? Hvad har firmaet brug for? Hvilke trusler er der? Hvilke muligheder? Og hvad har vi brug for at vide? Herefter kan du begynde at se på, hvilke datasæt der allerede er til rådighed, og hvilken type data, vi vil være i stand til at trække både internt og eksternt. Og såkan du begynde at se på teknologi, og hvis big data kan være med til at skaffe svar på dine spørgsmål, gælder det bare om at komme i gang,« siger Angel Diego Cuñado Alonso.

»Det handler grundlæggende om at fortælle historier. At finde en insight og fortælle en historie. Vi kan se dette, og det betyder det her. Du skal være i stand til at kommunikere det,« supplerer Johannes Scheibe.

Big data transformerer industrien ved at skabe maskiner, der kan høre, se og reagere mere effektivt. Læs hvordan brugen af big data skaber nye muligheder her.

Meget data er ikke nødvendigvis big data

I mange virksomheder giver det derfor mere mening at finde en person, der er i stand til at forstå sammenhænge i tal og er skarp på virksomhedens mål, end at ansætte en dygtig teknikker. For i de fleste situationer er det rigeligt til at analysere virksomhedens data. Bare fordi der er tale om rigtig meget data fra rigtig mange personer, er det ikke nødvendigvis kompliceret nok til at blive kaldt big data.

Johannes Scheibe mener, at det i mange virksomheder vil være at skyde gråspurve med kanoner at ansætte folk til at programmere algoritmer, hvis din virksomhed primært skaber data, der kan håndteres ved at sortere og filtrere i Excel.

»Jeg mener, at du bør starte med at skrive ned, hvilke teknologier du bruger, og hvad du har behov for at vide. Hvad kan du ikke besvare med de folk, du har til rådighed i dag? Hvis du har brug for nogen, der er virkelig gode til at kommunikere resultater og stå for kontakt til interessenter i huset, er det formentlig ikke en god ide at ansætte en »data scientist« med baggrund i machine learning, for de har en tendens til at være dårligere til at forklare ting. Så start med at kigge på, hvad virksomheden har brug for, siger Johannes Scheibe.

pix-Andreas Mundt

Du kan som et eksempel lave en simpel beregner for huspriser baseret på postnummer og antallet af værelser. Det er formentlig også til at håndtere, hvis du tilføjer områdets skattetryk, karaktergennemsnit fra områdets skoler og prisen på tidligere solgte huse.

Men hvis du skal lave en virkelig effektiv beregner, er du også nødt til at se på fx rumdeling og husets stand. Det kan du gøre ved at analysere plantegninger og billeder, men så står du pludselig med data, der ikke som priser, antal osv. kan sættes ind i en traditionel Excel-tabel. Big data.

Big data kræver machine learning

Og er diagnosen i din virksomhed big data, kommer du formentlig ikke uden om hjælp fra folk, der kan begå sig i krydsfeltet mellem matematik, statistik og kode. For her kan avancerede algoritmer og machine learning/deep learning være en stor hjælp.

»På nogle områder er vi ved at nå til grænsen for, hvad et menneske kan klare. Et menneske kan kun håndtere en bestemt mængde informationer, før det bliver for meget. Machine learning er en metode, der kan løse dette problem. Med machine learning laver du en algoritme, der ser på dine data og finder mønstre. Algoritmen forudser ting,« siger Angel Diego Cuñado Alonso.

Machine learning, deep learning og kunstig intelligens er begreber, der går sin sejrsgang i store virksomheder som Google, Facebook og Nvidia. For at håndtere big data har du måske brug for en art kunstig intelligens til at skabe logik i data, der ikke umiddelbart kan opstilles i kolonner.

pix-Vallensbæk Havn

Et eksempel er en maskine, der sorterer æbler og appelsiner. Med traditionel kode vil vi være nødt til at skrive en masse regler for, hvordan en appelsin og et æble ser ud. Farve, størrelse, form osv. Men i de fleste tilfælde vil det kræve så mange regler, at det bliver umuligt for et menneske at håndtere. For hvad nu hvis appelsinen er muggen? Farven er anderledes, og den er måske skrumpet, men det er stadig en appelsin. Derfor tyer folk til machine learning.

»Med machine learning kan du lave en algoritme, der vil lære at løse opgaven ud fra data. Vi fortæller ikke algoritmen, hvor stor et æble er, eller hvilken farve den er. Nej, vi tager et æble og siger, at dette er en æble. Og vi tager en appelsin og siger, at dette er en appelsin. Når vi har vist algoritmen tilstrækkeligt mange forskellige æbler og appelsiner, vil den have lært at skelne mellem dem. Den vil skabe sine egne regler for, hvordan den skal løse opgaven,” forklarer Angel Diego Cuñado Alonso.

Læs også om den danske IT virksomhed Itelligence der bruger big data og geotracking i fiskeindustrien til at forudsige, hvor fiskestimerne bevæger sig hen ad langs Australiens østkyst.

Skal du outsource?

Står du foran at starte din data-rejse, står du også hurtigt over for flere valg. Outsourcing eller inhouse - og centralisering eller decentralisering. Både Johannes Scheibe og Angel Diego Cuñado Alonso mener, at du generelt skal være varsom i forhold til at hyre dyre konsulenthuse til at drive big data-arbejdet. Vil du arbejde seriøst med big data, kræver det dedikerede ansatte.

»Som jeg ser det, er outsourcing ret farligt. Det kan kun fungere, hvis det er en engangs-analyse, og selv her er der en risiko for, at du får en stor og dyr rapport, som bare ender i en skuffe. Hvis dit arbejde med big data er et tilbagevendende fænomen, er risikoen ved at du ikke har ressourcerne i virksomheden, at du ikke ændrer grundlæggende på processerne og kulturen. Du ændrer intet, men du har et alibi. Rapporten er dit alibi for, at du har forsøgt, men den kommer til at ligge i skuffen,« siger Johannes Scheibe.

Om big data-arbejdet ligger bedst i en dedikeret enhed i virksomheden, eller det sker i de-centrale enheder rundt omkring i virksomheden, afhænger til gengæld af virksomheden.

»Der er fordele og ulemper ved begge modeller. Hvis du arbejder decentraliseret, og du er den eneste analytiker i dit team, vil du løbende sikre dig, at dine analyser holder. Du ønsker en form for kvalitetssikring af dine analyser, samt at du benytter de samme data som analytikerne i virksomhedens andre teams,« siger Johannes Scheibe.

»Men hvis din kollega fra et andet team udelukkende er der for at validere dine data, kan det være svært, hvis det ikke sker på regelmæssig vis. Så du skal sikre dig, at de forskellige teams ofte sætter sig sammen og deler insights, og at de benytter samme metodologi.«

Faren ved at have et centraliseret hold, der arbejder med big data, er til gengæld, at enheden mangler forståelse for, hvad der foregår i resten af organisationen. Derfor er det afgørende at have styr på interessenterne/stakeholder management. Kort sagt: What does the people want in the business unit and how can we serve them?

Hvor er der muligheder

Mange virksomheder arbejder i dag med data. Big data eller small data. Johannes Scheibe nævner BioTech og MedTech som nogle af de områder, hvor der sker interessante ting i øjeblikket.

»Der, hvor der virkelig sker noget inden for machine learning, er pharma-virksomhederne. Ved hjælp fra machine learning kan vi forudsige, hvordan mennesker vil reagere på et medikament,« fortæller han og peger på, at vi med The Human Genome Project, hvor det menneskelige genom blev kortlagt, har fået en dybere forståelse for den menneskelige krop.

Derudover peger han på den finansielle sektor som et oplagt område for arbejde med big data til for eksempel at undgå bedrageri, ligesom jura hurtigt kan stå for skud, da det er et område bygget på faste regler, og hvor en computer via machine learning kan læse tusindvis af sider og gennemskue sammenhænge.

Artiklen er oprindeligt udgivet på universe.ida.dk.

0 Kommentarer

Forsiden lige nu

Til forsiden

Business anbefaler

Gratis breaking news på mobilen

Send BUSINESS BREAK til 1929 og modtag en SMS med en bekræftelse. Det er gratis - tilmelding koster kun almindelig takst. Du kan til hver en tid afmelde tjenesten igen.

Afmeld: sms BUSINESS BREAK STOP til 1929

Tilmeld Afmeld

Business Nyhedsbrev

Få breaking news og det bedste overblik fra Business.dk morgen og eftermiddag - eller modtag hver uge et prioriteret overblik over investorstof, privatøkonomi, ejendomme, digtal, karriere, media og vækst.

Se alle nyhedsbreve
 

Business i billeder

Se alle

BrandView Hvad er Brandview?

BrandView er en service fra Berlingske Media, hvor virksomheder har mulighed for at kommunikere deres specialviden direkte til brugere og læsere af Berlingske.
Dette kan gøres på print i Berlingske og Berlingske Business, eller online på b.dk og business.dk.

Ønsker du at vide mere om BrandView, bedes du kontakte content marketing afdelingen Public Impact via e-mail: info@publicimpact.dk.

<p>Henrik Olejasz Larsen, investeringsdirektør i Sampension</p>
Sponseret

Aktiemarkederne ligger historisk set forholdsvis højt. Det afspejler, at det går rigtig godt i den underliggende økonomi, forklarer investeringsdirektør.Arbejdsløsheden er rekordlav i både Japan og US...

Business Events Se alle

Business.dk anvender cookies til at huske dine indstillinger, statistik og at målrette annoncer. Denne information deles med tredjepart. Læs mere

Kære læser. Velkommen til business.dk.

Vi kan se, at du har installeret en adblocker, så vi ikke kan vise dig annoncer. Det er vi kede af, fordi indtægter fra annoncer er en helt afgørende årsag til, at vi dagligt kan tilbyde dig journalistik af høj kvalitet.

Vi håber derfor, at du i din adblocker vil tillade visning af annoncer fra business.dk Det er nemt og tager kun et øjeblik: Se hvordan du gør her.

Med venlig hilsen
Berlingske Business

Tilbage til artiklen