Computere forstår ikke tekst og symboler indbygget. I stedet bruger de en kodning sprog er kendt som Unicode til at oversætte tal og bogstaver til deres passende tekst og symboler , der er kendt som en Tegnsæt . De mest almindelige typer af Unicode er UTF - 8 , UTF -16 , ISO - 8859-1 og ASCII . Der er en unik identifikator for hver tekstlige bogstav og symbol i Unicode , som forbliver konstant på tværs af forskellige operativsystemer og programmeringssprog . De fleste programmeringssprog har indbyggede funktioner til at oversætte mellem forskellige Unicode standarder. Instruktioner
1
Oversæt tegnsæt i PHP. Type " utf8_decode ( $ data) ", hvor "$ data " peger på UTF-8 kode. Den resulterende ISO -8859-1 tegnsæt udsendes .
2
Oversæt tegnsæt i Perl . Type " bruge Encode qw ( from_utf8 to_iso88591 )
from_to ( $ data," utf8 "," iso -8859-1 "); ". Erstat "fra - utf8 " med UTF- 8-kodet tegnsæt og " to_iso88591 " med den ønskede ISO -8859-1 -udgang.
3
Oversæt tegnsæt i Python. Indtast følgende kode .
Source_encoding = " utf -8 "
string = utf8variable
string = string.encode ( source_encoding )
string = unicode (streng, " iso -8859-1 ")
Erstat " utf8variable " med variabel holder UTF-8 tegnsæt .