Hvad er en tegndatatype?
En karakterdatatype er en datatype, der gemmer et enkelt tegn. Dette kan være et bogstav, tal eller symbol. Tegndatatyper bruges ofte til at gemme tekstdata, såsom navne, adresser og telefonnumre.
Tegndatatyper kan være enten med fast længde eller variabel længde. Tegndatatyper med fast længde gemmer et bestemt antal tegn, uanset den faktiske længde af dataene. Tegndatatyper med variabel længde kan gemme et vilkårligt antal tegn op til en maksimal specificeret længde.
Den mest almindelige tegndatatype er ASCII-tegndatatypen. ASCII-tegndatatyper gemmer 7-bit tegn, som kan repræsentere bogstaverne i det engelske alfabet, tal og almindelige symboler. Andre tegndatatyper omfatter Unicode-tegndatatypen, som kan repræsentere et bredere udvalg af tegn, herunder tegn fra ikke-engelske alfabeter.
Tegndatatype i Python
Python definerer en streng som en uforanderlig sekvens af bytes.
Vi kan lave strenge med enkelte eller dobbelte anførselstegn. Her er et par eksempler på strenge bogstaver i Python:
```
>>> string1 ="Hej"
>>> string2 ='Verden'
>>> string3 ="123"
```
Når vi ønsker at repræsentere en streng med en sekvens af ikke-ASCII-tegn, kan vi bruge 'u' eller 'r' før åbningscitatet:
```
>>> string4 =u"你好" # kinesiske tegn
>>> string5 =r"C:\Brugere\brugernavn" # Windows-sti
```
`u` før åbningscitatet angiver, at strengen er i Unicode-format, mens `r` angiver, at strengen er en rå streng, hvilket betyder, at omvendt skråstreg ikke tolkes som escape-tegn.