The American National Standards Institute eller ANSI, Character Set indeholder 256 tegn , fra det øverste og små bogstaver til tal , tegnsætning og accenttegn . Det standardiserede grundlæggende tegnsæt, der bruges af computerenheder , som definerer hvilke tegn til at inkludere og den rækkefølge, som at inkludere dem . De første 128 tegn i den fulde ANSI sæt fra nul til 127 , udgør de ASCII-tegn , der omfatter 32 styresekvenser . Fra 128 til 255, omfatter de udvidede ANSI-tegn bogstaver med accent , matematiske symboler og line- tegning tegn. Før Standards
verden af computing begyndte med en babylonisk tegnsæt , hver enhed maker definerer sit eget sæt af input og kontrol sekvenser. Disse tidlige system, der anvendes papir hulkort som deres data - lagermedie. De positioner på et kort, der indeholdt eller manglede slag bestemmes de oplysninger, den gemt. IBM, UNIVAC , FORTRAN , STRETCH : hvert af disse systemer, der anvendes forskellige karakter arrangementer og antal tegn. Uden en samlet standard , manglede disse enheder mulighed for at tale med hinanden .
ASCII
originale American Standard Code for Information Interchange , eller ASCII, tegnsæt begyndte i 1960 med computer pioner Bob BEMER , en IBM medarbejder, der indså, at punch -card kaos af konkurrerende tidlige operativsystemer holdt tilbage computer vedtagelse. På det tidspunkt brugte IBM sig selv forskellige ni- tegnkodninger blandt sine produkter. BEMER forelagde en kode - sekvens forslag ANSI, som i sidste ende godkendt en plan meget lig BEMER oprindelige . Atten år senere, IBM PC blev den første computer, der bruges ASCII.
ASCII Characters
anbragt i et numerisk gitter, der strækker sig fra nul til 128 , ASCII-tegnsættet begynder med et sæt af 32 styresekvenser , hvoraf nogle ikke længere se udbredt anvendelse , og andre , såsom " ESC ," at forblive en del af dagens computing. Den " rummet" tjener som tegn 32 , den 33. i sættet , efterfulgt af ikke- alfabetiske symboler såsom hash mark , dollar tegn , tegnet og tegnsætning . Numrene nul til ni udgør tegn 48 gennem 57 , efterfulgt af mere tegnsætning og matematiske symboler . Den store bogstaver alfabetet fra 65 gennem 90 , efterfulgt af flere ikke - alfabetiske tegn . Afrunding ud ASCII sæt , 97 gennem 122 hold små bogstaver , efterfulgt af krøllede parenteser , rør symbolet , for tilde og " DEL ", eller delete , karakter .
Udvidede tegn < br >
sande ANSI tegnsæt vier positionerne 128 til 255 på de tegn med accent , der anvendes af de fleste europæiske sprog, herunder to- tegnkombinationer kaldet digraphs samt store og små vokaler og konsonanter . Sammen med pre -made fraktioner , ikke -engelsk tegnsætning, graden symbol og nogle alfanumeriske hævet skrift , også omfatter de græske tegn og ligning symboler almindelige i matematik, og et sæt af tegn, bruges til at trække enkelt - og dobbelt - regerede kasser ligner rammerne omkring HTML-tabeller .
Beyond og Sideløbende ANSI
Sammen med den sande ANSI tegnsæt , Microsoft Windows ANSI sæt definerer en variant med en forveksling ligner navn og væsentlige tilsvarende tegn. Det mangler ANSI line- tegning figurer og omfatter andre skilletegn stedet , blandt dem to varemærke symboler, copyright symbol, et pre-made ellipse punktet, stående , em - bindestreg og en- dash . Ud over de traditionelle 256- tegn begrænsninger af ANSI, gør Unicode mulige tegnsæt med tusindvis af glyffer , imødekommende stort set alle verdens sprog, herunder dem, der ikke anvender det latinske alfabet , såsom asiatiske og Mellemøstlig sprog.
< br >