Blog: Big Data? Glem det

Big data er en hype som ikke har rod i realistiske forventninger. Eksemplerne på gode business cases er få og anekdotiske og stammer fra firmaer, der er så langt fra hvad almindelige gennemsnitsfirmaer vil kunne stille op til. Det grundlæggende problem er at det simpelthen er for svært at få noget brugbart ud af big data. Man skal have en universitetsgrad og samtidig have indsigt i hele forretningen.

Indtil for nyligt var tech miljøet ved at gå cloud bananas. Man kunne simpelthen ikke sige to sætninger uden at ordet cloud skulle nævnes. Jeg har tidligere skrevet hvordan ordet cloud i betydning var meget tæt på tryllestøv:

nu er turen kommet til en ny smart ting som hedder big data. Det har fuldstændig samme betydning nemlig “Tryllestøv”. Tag en hvilken som helst overskrift hvor big data indgår og erstat det med tryllestøv. Betydningen er fuldstændig det samme.

et eksempel er denne artikel fra politiken: tryllestøv vil vende op og ned på din verden!

eller denne fra Version 2 hvor Yahoo ufordrer udviklere til at kaste tryllestøv efter 99 millioner billeder. Det er også præcist det artiklen handler om: at der på magisk vis sker et eller andet fantastisk hvis bare man smider noget big data på det.

Hvad er big data?

Nu har jeg brugt en stor del af mit live på at forstå og analysere begreber, så lad os starte med at finde en fornuftig betydning af big data.

De mere sobre bud, som rent faktisk rammer noget vi ikke i forvejen kunne kalde Business Intelligence, Analytics, Machine Learning eller Artificial Intelligence går ud på at big data skal indeholde de tre V’er: Velocity, Volume og Variety.

Det er således ikke nok, at der bare er store datamængder. Heller ikke, at de er forskelligartede. Det skal også være noget, som skal kunne tilgås hurtigt. Googles søgemaskine er faktisk et rigtigt godt eksempel på ægte big data. En masse meget forskelligartet data bliver analyseret og lavet om til fornuftige resultater. Man kan måske diskutere, hvor hurtigt det sker.
Facebook er et andet eksempel på, hvordan dit newsfeed tager hensyn til store mængder data. Det er meget varieret, da der både er struktureret data som likes, og relation til venner samt ustruktureret data som tekst, der tilsyneladende bliver analyseret på forskellige måder.
Der er jo også twitter, som løbende holder styr på trending topics på baggrund af et hav af tweets. De kan også udvælge, hvad de tror er vigtigt for dig ved at kigge på positionen, hvor nyt det er, dine venner, hvor stor indflydelse den der poster har, hvor mange der deler og så videre.

Og det er så vel det. Ingen andre firmaer får konsekvent noget fornuftigt ud af big data.

Jobbeskrivelsen som Big Data medarbejder

For at få noget ud af big data skal man have et meget åbent sind, være nytænkende og have kendskab til alle mulighederne og teknikkerne. Hvis du skal lave en god big data løsning skal du have styr på dine machine learning algoritmer, for at finde ud af hvilke typer af algoritmer skal bruges til forskellige typer af problemer. Grundbogen i machine learning er på cirka 1000 sider og, helt ærligt, hvem gider læse det, når man kan sidde og fnise over tweets, youtube videoer eller skrive vrede anmeldelser på trustpilot.

Dernæst skal du have en smule fingerspitz gefuhl med skalerbare arkitekturer, no sql databaser, sharding og distribueret computing. Godt nok kun til husbehov. Det ville også være fint hvis du selv lige kunne sidde og rode med lidt kode for at prøve dig frem.

Ud over det skal du være interesseret i hvordan firmaets forretning er skruet sammen. Hvad er de væsentligste drivere for vækst? og hvordan er købscyklussen hos kunden og forretningsmodellen?

Den persontype, som er nødvendig er meget sjælden og endnu færre firmaer vil kunne overbevises om at ansætte dem, da det er meget uklart hvad sådan en filur kan bibringe af værdi: “Så din spids kompetence er gode ideer og tykke bøger. Du roder lidt med noget teknologi men er ikke helt skarp på at kode, men meget interesseret i hvordan forretningen er skruet sammen?”, som vi sagde i musik miljøet dengang jeg stadig prøvede at gro et garn når vi havde haft håbefulde omend talentløse musikere til audition: “Vi ringer”.

Hvorfor big data vil fejle

Problemet er at Big data er grundforskning. Ligesom grundforskning er det meget usikkert om man vil få et resultat. Man skal udvikle hypoteser om sammenhænge, hvilket kan være ret svært, hvis man er som danske firmaer er flest. I Danmark er discount mentaliteten fremherskende: hvis man kan få noget lidt billigere eller sælge det lidt dyrere, så er det simpelthen det eneste som tæller. Big data kræver dog mere en pioner mentalitet, hvor man aldrig kan garantere, hvad der ligger rundt om hjørnet eller, eller om der overhovedet er noget. Det kræver en vilje til at gå ud i ukendt territorium at gå udenfor sin comfort zone og det er jo ikke den klassiske beskrivelse af hygge vel? Men selv om jeg er kritisk overfor Danmark vil jeg faktisk ikke mene at vi står tilbage for andre lande. Vi har dog trods alt en relativt innovativ tilgang til livet, og er ikke udpræget begrænset af vanetænkning i forhold til de lande vi ellers sammenligner os med.

Det er i sidste ende kun et fåtal af firmaer, som er villige til at smide en million efter et projekt, der ingen garanti har for at få noget resultat. Det er kun fantasifirmaer som google, twitter og facebook, hvor alle normale økonomiske love er ophævet, hvor en sådan ting kan trives. De fleste firmaer i verden er konservative, og vil have en garanti for deres investering. Det er der ikke for big data.

Derudover kræver det nosser rent faktisk at stole på de overraskende resultater, som man får ud af det. Hvor mange andre firmaer end netflix ville have kugler nok til at satse flere millioner på at producere en tv serie ud fra analyser de havde lavet af deres data? Nej vel.

Så derfor: big data: glem det.

For de fleste firmaer giver det mere mening at gå tilbage til deres data warehouse og ryde op i data og bygge nogle lidt mere intelligente rapporter, gennemtænke KPIer og koncentrere sig om master data. Man kan også med fordel ansætte en studentermedhjælper til at sidde og grave lidt i data. Han kunne jo finde noget spændende.

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>