Kikset kryptering gjorde det nemt at afsløre alle New York-taxaers kørsel

Ideen var ædel – at lægge indsamlede data om taxakørsel i New York ud offentligt, så andre kunne få glæde af disse unikke informationer.

Men et forfejlet forsøg på at anonymisere, hvilke taxaer og chauffører, der har kørt hvilke ture, har gjort at New Yorks bystyre nu er endt med en data-skandale, som kan bruges til at kortlægge chaufførernes præcise færden.

Det skriver udvikleren Vijay Pandurangan i en længere artikel, der er blevet taget op af blandt andet sikkerhedsguruen Bruce Schneier.

Dataene for taxanummer og chaufførnummer blev kørt igennem en MD5-hash-funktion, før de blev offentliggjort, for hvis hashingen var gjort rigtigt, ville det være umuligt at oversætte hash-værdierne tilbage til de oprindelige data.

Problemet var bare, at både taxanumre og chaufførnumre følger bestemte skabeloner, så der var til sammen kun 24 millioner forskellige muligheder for begge værdier. Det tog kun to minutter at beregne hash-værdierne for de 24 millioner muligheder, og med en klynge på 10 computere tog det under en time at parre dem med dataene. Dermed var anonymiseringen helt brudt.

Den rigtige løsning, der ville have beskyttet taxachaufførernes identitet og færden, ville have været at bruge et ’salt’, altså at udvide hvert datasæt med hver sin tilfældige værdi. New York by kunne også have krypteret dataene med AES og bruge en nøgle, som kun de selv kendte.

MD5 er i øvrigt ikke længere en sikker funktion, men det var ikke svaghederne i MD5, som blev brugt til at knække nødden her, men svagheder i måden den blev brugt på.

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>