Computer genkender ansigter bedre end mennesker

Vi mennesker er rigtig gode til at genkende ansigter. Hvis vi bliver præsenteret for to portrætter, kan vi med uhyre stor sikkerhed sige, om det er samme person, der optræder på billederne. Faktisk gætter vi rigtigt i 97,53 procent af tilfældene.

Men nu er vi blevet overgået af en computer. To kinesiske forskere fra Det Kinesiske Universitet i Hong Kong har udviklet og testet en ny algoritme til ansigtsgenkendelse, og her er succesraten oppe på 98,52 procent.

I en artikel på preprint-serveren ArXiv skriver forskerne, at det er første gang, at en computer klarer opgaven bedre end mennesker. Den nye algoritme kaldes GaussianFace, og den er en smule bedre end Facebooks DeepFace, der byder på en præcision på 97,35 procent.

Den form for ansigtsgenkendelse, hvor to billeder af samme person skal matches, er ellers en ret vanskelig opgave for en computer. Det gælder især, hvis lysforholdene på de to fotos er forskellige, hvis personen har drejet hovedet i forhold til kameraet, eller hvis ansigtsudtrykkene er forskellige.


Det er skuespilleren Johnny Depp på begge billeder, men kan en computer nu også se det? (Fotos: LFW)

Netop derfor benyttes databasen Labeled Faces in the Wild ofte, når udviklere af ansigtsgenkendelsessoftware skal teste algoritmer. Databasen rummer nemlig mere end 13.000 billeder hentet ned fra internettet, og 1.680 af de navngivne personer på billederne optræder to eller flere gange i databasen.

Eftersom billederne er høstet fra nettet og ikke er pæne pasfotos, er der stor forskel på, hvordan personerne optræder på dem, så billederne er en god udfordring for algoritmer til ansigtsgenkendelse. For eksempel kan skuespilleren Johnny Depp være sminket som sørøver i Pirates of the Caribbean på det ene billede og posere på den røde løber til en Oscar-uddeling på det andet.

GaussianFace finder først øjne, næse og mundvige hos personen på billedet, og ud fra disse fem punkter bliver der konstrueret et 150 x 120 pixels billede af ansigtet set forfra. Billedet deles op i overlappende felter på 25 x 25 pixels, og hvert af disse felter bliver repræsenteret af en vektor. Så bruges samlingen af vektorer i sammenligningen af billeder.

Algoritmen blev først trænet ved hjælp af tusindvis af billeder fra andre databaser, før den blev sluppet løs i databasen Labeled Faces in the Wild.

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>