Maskinlæring er blevet tilgængeligt for masserne

Maskinlæring er ét af de buzzwords, som har sneget sig ind på it-scenen det seneste års tid. Både Microsoft og Google taler således om maskinlæring, eller machine learning. Det er et felt inden for datalogien, som har eksisteret i årtier, men som nu har fået en opblomstring inden for ét bestemt område.

»Maskinlæring dækker over data mining. Maskinlæring kan generelt bruges til mange forskellige ting, men lige nu bliver det brugt til at analysere data,« forklarer stifter Rafal Lukawiecki fra konsulentfirmaet Project Botticelli til Version2.

Selve området maskinlæring bygger på algoritmer, hvoraf mange er udarbejdet for 40 år siden i datalogiens ungdom. Forskellen fra dengang og til i dag er dog, at kapaciteten til databehandling nu gør det muligt at udnytte algoritmerne til formål, hvor erhvervskunderne har fået øje på teknologien.

»Før manglede hestekræfterne. Nu har skyen gjort det til noget, hvor du næsten blot skal trykke på en knap, og så kan du være i gang med data mining. Men den største ændring er nok, at virksomhederne er begyndt at efterspørge det,« siger Rafal Lukawiecki.

Data mining ved hjælp af maskinlæring er den seneste udvikling inden for business intelligence og Big Data. Maskinlæringsalgoritmerne er blevet taget i brug, fordi de kan anvendes til eksempelvis at forudsige kundeadfærd i e-handel, hvilke varer der skal være på lager, risikoanalyse og sporing af svindel.

Efterspørgslen efter analyseværktøjer, som udnytter de voksende datamængder, har ført til næsten køreklare maskinlæringstjenester som eksempelvis Microsoft Azure ML.

»Det nye er, hvor tilgængeligt det er blevet. I fremtiden vil det formentligt blive så let at gå til, at en almindelig Excel-bruger kan benytte maskinlæring,« siger Rafal Lukawiecki.

Der er især store virksomheder, som har benyttet sig af maskinlæring og data mining i mere end 20 år, men det har krævet særlige udviklingsressourcer og programmering specifikt til netop ét bestemt formål. Det er ændret med de nye grydeklare produkter.

»Flertallet vil ikke udvikle selv. De vil bare gerne kunne kaste data efter en løsning. I dag er vi eksempelvis dér, hvor du kan sammenligne forskellige algoritmer for at se, hvilken der er bedst, blot med nogle klik,« siger Rafal Lukawiecki.

Hvis man skal anvende data mining fornuftigt, så er det dog stadig en god idé at sammensætte et hold med kompetencerne til at omsætte teknologien til noget, der kan bruges af organisationen. Ifølge Rafal Lukawiecki betyder det, at man bør få dækket tre områder.

Først skal man bruge en person med kendskab til den forretningsmæssige side af det område, man vil analysere. For at kunne analysere kundeadfærd på en måde, hvorpå forretningen kan bruge resultaterne, så skal analysemetoden passe til formålet.

Dernæst er det nødvendigt at have en person, som forstår data og har erfaring med at kunne trække data ud fra mange forskellige kilder og eksempelvis kunne overskue et datavarehus. Det må gerne være en person, som kan fungere som datadetektiv for at finde frem til de rette data og strukturere dem.

Endelig skal man bruge en analytiker, som ikke nødvendigvis skal have en ph.d. i statistik, men først og fremmest være i stand til at vurdere, om resultaterne af en analyse stemmer overens med det, man ville forvente.

En af farerne ved at overlade analysen til et sæt prædefinerede algoritmer er, at hvis man vælger den forkerte metode, så får man også forkerte resultater, men det kan være vanskeligt på forhånd at vide, hvilken analysemetode der passer bedst til situationen.

»Alle algoritmer vil give dig et resultat, men det er ikke alle resultater, der er brugbare. Derfor skal man kunne forstå en given models holdbarhed,« siger Rafal Lukawiecki.

Selvom feltet maskinlæring er gammelt, så er der også inden for de senere år dukket nye algoritmer og metoder op, som eksempelvis er beregnet til at udnytte nogle af de ting, som udviklingen i hardware og software har givet mulighed for. Det gælder eksempelvis in-memory-teknologi.

»Hvis man gerne vil dyppe tæerne i maskinlæring for første gang, så har man muligheden for at komme til at lege med nogle af de nye legesager, som de erfarne inden for området også først nu har fået adgang til. De seje, nye ting kan ikke løse alle opgaver, men de er meget spændende, fordi det er nye måder at løse problemerne på,« siger Rafal Lukawiecki.

Lige nu er maskinlæring på kommercielt niveau stort set synonymt med data mining, men udbredelsen af maskinlæring kan føre til, at andre dele af feltet kan få større anvendelse.

Det kunne ifølge Rafal Lukawiecki være applikationer, som får mere indbygget kunstig intelligens til at understøtte applikationernes indbyggede logik – eksempelvis i kommunikationen mellem applikationer.

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>