? Med MySQL, er der to mulige tegnsæt til rådighed for dine data skal lagres i. Disse Unicode tegnsæt afspejler mængden af data , der er lagret per karakter i MySQL-database . Den tre-byte UTF-8 Unicode -kodning (UTF -8) tegnsættet er almindeligt anerkendt, men det er ikke standard tegnsæt for MySQL. Hvad Er tegnsæt ?
Tegnsæt er sæt af standarder, som indeholder alle de tilgængelige tastatur inputtaster . Den første populære tegnsæt ASCII arbejdede godt for det engelske sprog , men som andre nationer begyndte at bruge computere, og de behov diversificeret, blev nye tegnsæt påkrævet. UCS -2 og UTF-8 er begge tegnsæt i stand til at indlæse data fra næsten enhver tastatur i verden .
UCS -2 Unicode -kodning (UCS -2)
UCS -2 er et tegnsæt, der bruger 16 bits per tegn, støtter Basic Multilingual Plane ( BMP) . Til sammenligning brugte ASCII kun én byte . Den bit - koden værdier mellem 0 og 65535 , og i UCS -2 , kan kodes i en fast 16-bit ord.
Tre- Byte UTF-8 Unicode-kodning < br >
Med UTF-8 er det samme tegnsæt og bit - code interval bruges som UCS -2 , men den bruger kun mellem 1-3 bytes per karakter. Henviser UCS - 2 kan kodes i en fast 16 - bit ord , UTF -8 koder for enten 8 , 16 eller 24 bit . UTF-8 er en nyere standard end UCS -2 .
Hvorfor MySQL Standard er UCS -2
MySQL er en meget gammel database ansøgning og dets oprettelse forud massen gennemførelse af UTF -8 . Derfor har MySQL altid favoriseret UCS - 2 , som er egnet til de fleste database implementeringer . Hvis du ønsker at benytte UTF- 8 i stedet , kan du gøre det ved at ændre databaseindstillinger .