Big data-ekspert: Sådan kommer du i gang

Patricia Florissi

Patricia Florissi burde have et af den slags visitkort med en ekstra flap, som du kan folde ud – og hvor alle de imponerende titler kan oplistes: PhD, MBA og ikke mindst CTO hos storage- og cloud-giganten EMC.

Så jeg blinker en ekstra gang, da hun – efter sin keynote på EMC’s forum i København – starter med at byde mig et stykke ost fra en serviet, der indtil for to minutter siden lå i lommen.

Vi skulle egentlig snakke om it-afdelingerns rolle i en verden fascineret af big data-hypen, men den knap så corporate-tilgang til interviewet får mig til at starte et andet sted, imens jeg gumler på min velsmagende oste-gave:

Hvorfor diskuterer vi big data nu? Hvad er det, som er kommet på plads, så det er relevant?

“Det er der en meget simpel grund til. I starten af 90′erne havde virksomhederne købt it til enten forskning i for eksempel simuleringer eller til business-brug, som CRM eller økonomisystemer. Omkring år 2000 skabte Google skyen til noget, som hverken var forskning eller traditionel business. Det de gjorde var at bringe it til massemarkedet på en måde, som ikke var fysisk placeret hos folk.”

“Dermed så virksomhederne, at det var nemt at samle data. I 2010 viste Google så virksomheder, at de med deres tilgang også havde både skalerbarhed og var billigere. Det skulle på plads først,” forklarer Patricia Florissi.

Hun sammenligner udviklingen med den, som den traditionelle industriproduktion har gennemgået:

“Big data handler om de forskellige måder, som man gør tingene på. Men man skal have produkterne. Mange af de ting, vi kender i dag, kunne man ikke skabe, før aluminium kunne forarbejdes eller før fiber-teknologi – man skulle først opnå kvalitet og de rette forarbejdningsprocesser.”

De sidste år er big data-begrebet blevet brugt mere. Men hvordan definerer du big data? Hvad er det egentlig?

“Det er for mig et hvilket som helst dataset, som får dig til at tænke på en anden made. Så hvis du ikke er i gang med noget, som får dig til at analysere på en anden måde – som udfordrer den måde du tænker på – er det ikke big data. Big data er et relativt koncept, ikke et absolut”, forklarer Patricia Florissi og fortsætter:

“Big data handler for mig slet ikke om størrelsen. Langt hovedparten af data er nye data – det er data, som du ikke tidligere kunne få. Derfor handler det ikke om størrelsen, men om granuliteten i data, altså hvor fine data-kornene så at sige er.”

Fortsættes …

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>