Unicode Transformation Format (UTF- 8) er en tegnkodning format, der bruger otte -bit blokke til at repræsentere et tegn, og er meget udbredt i edb-systemer. Det omfatter den samme kompakte almindelig tekst kodning som ASCII-format , men giver også mulighed for kodning af specialtegn. Dette giver det ekstra funktionalitet, men rummer udfordringer , når de anvendes i programkode. De senere versioner af Perl skib med kodning moduler og en binmode funktion , der tillader programmeringssprog til at håndtere kodning og afkodning af UTF-8 -filer. Input og output til /fra en Perl program kan gøres for at håndtere UTF- 8 tegn ved hjælp af en kontakt på kommandolinjen. Ting du skal
ActiveState Perl
Perl editor
Vis Flere Instruktioner
1
lancere Perl editor til at starte kodning Perl program. Du kan bruge en simpel teksteditor , som Notesblok på Windows eller VI editor på UNIX. Du bliver nødt til gemme filen med et . Pl udvidelse , så systemet vil være i stand til at genkende det som et Perl -program.
2
Placer en bydende nødvendigt at kræve " Encode "-modulet i toppen af Perl -programmet . Du vil være i stand til at bruge kodning og afkodning funktioner i kroppen af Perl Program til at indkode /afkode data til /fra UTF- 8-format , som det kræves . Skrive følgende ind i Perl editor til at bruge denne metode : Hej
# /usr /bin /perlrequire Encode , Alternativt kan du ringe til Encode modul , som følger: ! Bruge Encode , at indkode data , skal du skrive følgende i kroppen af dit program : $ output = Encode :: indkode ( " utf8 " , $ string ),
3
Angiv UTF -8-kodning format, når du åbner en fil . Du kan gøre dette ved at skrive en af følgende formater, i editoren:
åben fil , " < : kodning ( iso -8859- 7)" , $ inputfil ,
åben fILE , " < : utf8 " . , $ inputfil ,
Dette vil fortælle Perl at indkode filen i UTF- 8-format , eller til at forberede sig til UTF -8-kodning
4
Angiv " binmode " når du læser eller skriver filer , for at sikre , at filerne er kodet i UTF- 8 format.
For at indstille binmode til UTF-8 , når du læser en fil , skal du skrive følgende i editoren : $ filename = " filename.txt " $ inputfil = IO :: Fil-> Ny ( $ filename , " r "); binmode ( $ inputfil « : utf8 ');
< p > hvis du vil indstille binmode til UTF-8 , når du skriver til en fil, skal du skrive følgende i editoren : $ filename = " filename.txt " open (OUT , "> $ filename ") binmode (OUT " ; : utf8 ")
Du kan også bruge binmode til at indstille formatet for standard input og output til UTF -8, som følger: binmode ( STDIN ' : utf8 '); binmode ( STDOUT « : utf8 ');