" Floating point " er den måde computere repræsenterer reelle tal som 11.625 . Disse numre er virkelig to numre - mantissen og eksponenten . Mantissen består af de faktiske tal og eksponenten bare fortæller , hvor kommaet går. Dette svarer til at skrive 11,625 i videnskabelig notation : 1,1625 x 10 ^ 1. . Mantissen er 1,1625 og +1 er eksponenten . Konvertering dette i binær notation er en enkel proces, der tager kun et par skridt . Instruktioner
1
ændre den del af nummeret til venstre for decimaltegnet til binær notation af en række afdelinger med 2 . Hvis du konverterer 11,625 til binær , skal du gentagne gange opdele 11 - og så kvotienter - med 2 indtil 11. er væk. De rester , i omvendt rækkefølge af udseende , vil være den binære konvertering. 1.1 /2 = 5 med resten 1 , 5/2 = 2 med resten 1 , 2/2 = 1 med resten 0 og 1/2 = 0 med resten 1 . Resterne , i omvendt rækkefølge udseende, var 1, 0 , 1 og 1 , derfor 11 decimal = 1011 binær .
2
ændre den del af nummeret til højre for kommaet til binær notation ved en serie af multiplikationer med 2 . At konvertere 0,625 til binær , start ved at multiplicere 0.625 med 2 for at få 1.25. Optag den 1 , og fortsætte med 0,25. Nu formere 0,25 ved 2 for at få 0,5 . Optag 0 , og fortsæt med 0,5 . Endelig formere 0,5 med 2 for at få 1.0. Optag den 1 , og stoppe, fordi der er intet tilbage at formere sig. Det betyder, at 0.625 decimal = 0.101 binær .
3
Sæt de to dele af konverteringen sammen for at få 11,625 decimal = 1011,101 binær . I computeren denne binær streng vil blive repræsenteret af en binær floating point skema. Den nøjagtige skema for at oprette binære floating point varierer fra den ene computer producent til en anden , men mantissen ville være 1011101 og eksponenten ville sandsynligvis være 3 - hvilket er 11 i binær . Hvis du bruger 16 bit registre med 11 bits for mantissen efterfulgt af 5 bits for tegnet , ville floating point konverteringen være 0000 1011 1010 0011 .