Reddit er bygget oven på ulogisk algoritme

Der er rod i matematikken hos det enorme sociale nyheds- og underholdningssite Reddit. Sitet er bygget op omkring, at brugere poster indhold, som vurderes af andre brugere ved simpelthen at stemme indlægget op eller ned.

Men den altafgørende algoritme, som sorterer indlæg efter, hvor populære de er, bygger på en ulogisk matematisk formel, som bloggeren og udvikleren Ian Greenleaf Young har kigget nærmere på.

Den specifikke stump kode, som afgør et indlægs skæbne, vægter hvilke parametre, der er vigtigst ved et ‘hot’ indlæg. Således spiller tid en faktor, samt summen af negative og positive stemmer, et indlæg har fået.

I koden har Reddit-udviklerne valgt at sætte et UNIX-timestamp, som indlæggets ‘tidsscore’, hvilket naturligvis altid vil være højere end ældre indlæg og dermed give nyere indlæg en fordel.

Indlæggets sum af op- og ned-stemmer reduceres til en værdi af enten 1 eller minus 1 alt afhængigt af, om summen er positiv eller ej.

Samtidig vægtes op- og ned-stemmerne ved at tage den numeriske værdi af stemmesummen og finde ti-talslogaritmen af summen og gemmes i variablen ‘order’. Her er det, at Ian Greenleaf Young regner med, at variablen ‘sign’ skal bruges til at sætte korrekt fortegn foran ‘order’, som i kraft af den tidligere logaritmeoperation altid vil være positiv.

Men det har Reddi-folkene valgt ikke at gøre. Ganske ulogisk bliver variablen ‘sign’ ikke ganget sammen med variablen ‘order’, men i stedet med variablen ‘seconds’.

Det betyder, at en total negativ score forværres, jo nyere indlægget er, da ‘seconds’-variablen dermed ville have negativt fortegn samt en større værdi i kraft af sin nyere dato. Dermed vil det nyere indlæg rangere lavere end ældre indlæg med samme antal ned-stemmer.

Endnu værre ser det ud for nye indlæg, der som det første får en ned-stemme. Disse indlæg vil i kraft af sin store negative ‘seconds’-værdi starte allernederst i hierarkiet og muligvis aldrig få den eksponering, de fortjener.

Alligevel mener folkene bag Reddit, at koden virker efter hensigten, og at det ikke er en fejl, at algoritmen sorterer ulogisk.

Ironisk nok ligger Ian Greenleaf Youngs indlæg om Reddit fejlagtige algoritme i skrivende stund på top tre over ‘hotte’ indlæg.

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>