ComputerProgramméieren

ASCII (amerikanesche Standardcode fir Informatiounsaustausch) - Basis Textkodéierung vum latin alphabet

Laut der International Telecommunication Union, am Joer 2016 hunn dräi an eng halle Milliard Leit d'Internet mat dësem oder déi Regularitéit benotzt. Déi meescht vun hinnen hunn net geduecht datt all Botze vun hinnen duerch PCs oder mobil Gadgeten, wéi och Texter déi iwwer all Typ vun Monitore geschéckt gi sinn, tatsächlech Kombinatioune vun 0 a 1. Eng sougenannten Vertriederung vun Informatioun gëtt als Kodéierung bezeechent. Et ass a wesentlech d'Ëmsetze vu senger Lagerung, Veraarbechtung an Iwwerdroung erliichtert. 1963 gouf d'amerikanesch Kodéierung ASCII entwéckelt, déi d'Thema vum Artikel ass.

Presentatioun vun Informatioun am Computer

Aus der Sicht vun all elektronesche Computer, ass de Text eng Kollektioun vun eenzel Symbolik. Zu senger Zuel gehéieren net nëmmen Bréiwer, ënner anerem grousse Bréiwer, awer och Zeechen, Zeechen. Zousätzlech sinn speziell Symbole "=", "&", "(" an Ënnerhalter benotzt.

De Satz vun Symbolen déi den Text zesummestellen, heescht den Numm Alfabet a seng Nummer ass d'Kraaft (déi als N bezeechent gëtt). Fir dat ze bestëmmen, benotzt den Ausdruck N = 2 ^ b, wou b d'Nummer vun Bits oder d'Informatioun Gewicht vun engem bestëmmten Symbol.

Et gëtt bewisen datt e Alphabet mat enger Kapazitéit vun 256 Zeechen all déi noutwendeg Symboler vertrëtt.

Zënter 256 ass d'8. Muecht vu zwee, d'Gewiicht vun all Symbol ass 8 Bits.

Eng Eenheet vun 8 Bits gëtt 1 Bytes genannt, also ass et üblech fir ze soen datt de binäre Code vun engem Charakter am Text deen op dem Computer gespaart gëtt e Punkt um Buedem.

Wéi eng Kodéierung gëtt ausgeführt

All Texter ginn an d'Erënnerung vum perséinleche Computer benotzt mat den Tastë vun der Tastatur, op deenen geschriwwe Nummeren, Bréiwer, Punctuatiounsspären a aner Symboler sinn. An Erënnerung se an iwwerdroen ginn Duebelstäresystem Code, dh, ass all Symbol fir d'Gewunnecht Dezimalzuel Code fir eng Persoun vun 0 bis 255, Ëmgéigend déi bis en Duebelstäresystem Code entsprécht - .. Vu 00000000 zu 11111111.

Byte-Byte-Zeechekodéierung erméiglecht den Prozessor datt Textveraarbechtung fir all Zeechentrennen getrennt accessibel ass. Zur selwechter Zäit sinn 256 Zeechen genuch fir all Charakterinformatiounen ze representéieren.

Character encoding ASCII

Dës Ofkierzung an Englesch steet fir amerikanesche Standardcode fir Informatiounsaustausch.

Och bei der Dämmerung vun der Informatisatioun war et kloer datt Dir mat enger breeder Offer vu Kodéierungsinformatioun ka kommen. Awer fir d'Informatioun vun engem Computer op en anere ze transferéieren, war et néideg fir een eenzegen Standard ze entwéckelen. Also, am Joer 1963 an den USA erschien den Dësch vun der ASCII Kodéierung. An et gëtt all Symbol vum Computer-Alphabet seng Seriennummer an der Binär Representatioun zugewielt. Am Ufank gouf d'ASCII-Kodéierung nëmmen an d'USA benotzt an duerno en internationale Standard fir de PC.

Table Contents

D'ASCII Codes ginn an 2 Deeler ënnerdeelt. Den internationale Standard ass nëmmen déi éischt Halschent vun dëser Tabelle. Si beinhalt d'Symboler mat Uergelzuelen vun 0 (encodéiert als 00000000) op 127 (Code 01111111).

Sequence Number

N

ASCII Text Kodéierung

Symbol

0 - 31

0000 0000 - 0001 1111

Symboler mat N vun 0 bis 31 sinn Direktiounskontrolle. Hir Funktioun ass den "Prozess" vum Text auszerechnen fir ee Monitor oder e Drucker ze maachen, en Audiosignal usw.

32 - 127

0010 0000 - 0111 1111

Charaktere mat N vun 32 bis 127 (den Standardtitel vum Dësch) - upper and lowercase Briefe vum laténgeschen Alphabet, 10 Zifferen, Punctuatiounsspuren, souwéi verschidde Klammeren, kommerziellen a aner Symboler. Den Symbol 32 bezeechent een Plaz.

128 - 255

1000 0000 1111 1111

Symboler mat N vun 128 bis 255 (en alternativen Deel vun der Tabell oder Codepage) kënnen verschidden Varianten hunn, déi all hir eegen Zuel hunn. Code Page gëtt benotzt fir d'national Alphabetes ze spezifizéieren, déi ënnerscheede vun der laténgescher. Besonnesch ass et mat senger Hëllef datt d'ASCII fir russesch Zeechen encodéiert gëtt.

Dësch Zeechesaatz Iwwerall an geschriwen Bréiwer sinn folgend all aner zu Alphabetesch Uerdnung an Zuelen - Elterendeel Wäerter. Dëst Prinzip ass och fir de russeschen Alphabet konservéiert.

Kontrollfiguren

D'ASCII-Kodéieretabelle gouf ursprénglech geschafft fir Informatiounen a Sendunge iwwer e Gerät ze kréien deen net laang gebraucht gouf, wéi en Teletyp. An dësem Zesummenhang war net-Neutraliséierung am Zeechensatz agefouert ginn, als Kommandoen fir dës Apparat ze kontrolléieren. Ähnlech Befehre goufe bei esou Precomputer Messagen als Morse Code benotzt.

De meeschtst "Teletyp" Symbol ass NUL (00, "Null"). Et ass nach ëmmer an de meeschte Programméierungssegkeeten benotzt, déi den Enn-of-line Charakter bezeechent.

Wou d'ASCII-Kodéierung gëtt benotzt

Den amerikanesche Standardcode gëtt net nëmmen fir Textinformatioun aus der Tastatur. Et ass och an der Grafik benotzt. Besonnesch am ASCII Art Maker Programm representéieren d'Biller vun verschiddene Verlängerungen eng Rei vun ASCII-Zeeche-Symbolen.

Ähnlech Produkter gi vun zwee Typen: d'Funktioun vun der grafescher Editioun duerch d'Konvertéieren vun Biller an den Text an d'Konvertéieren vun "Zeechnungen" an ASCII Grafiken. Zum Beispill, e bekannte Smiley ass e lieweg Beispill vum Kodiersymbol.

ASCII kann och benotzt ginn wann Dir en HTML Dokument erstellt. An dësem Fall kënnt Dir e bestëmmten Satz Charakter erlaben, a wann Dir déi Säit kuckt, gesäit e Symbol op dem Bildschirm deen dëse Code entsprécht.

ASCII ass och noutwenneg fir verschidde Sproochen z'erlaaben, well Zeechen, déi net Deel vun enger spezifescher nationaler Tabelle sinn, ersetzt mat ASCII Codes.

E puer Features

Fir encodéieren Text Informatioun an ASCII-Kodéierung, goufen 7 Bits zunächst benotzt (een war eidel), awer haut funktionnéiert et als 8-Bit.

D'Bréiwer déi an de Spalten an der Spëtzt an ënnen halen, ënnerscheeden nëmmen vun engem eenzegen Bit. Dëst reduzéiert d'Komplexitéit vun der Verifikatioun staark.

Benotzt ASCII an Microsoft Office

Wann néideg, kann dës Art vu Kodéierung vun textueller Informatioun benotzt ginn an Microsoft Text Editoren, wéi Notizblock an Office Word. Allerdéngs, wann Dir Schreifweis hutt, an dësem Fall et net méiglech sinn e puer Funktiounen ze benotzen. Zum Beispill, Dir kënnt net fett maachen, well d'ASCII-Kodéierung just d'Bedeitung vun der Informatioun hält, déi allgemeng Optriede a Form benotzt.

Standardiséierung

ISO huet ISO 8859 Standard ugepasst.Diese Grupp definéiert aacht Bit Encodings fir verschidden Sprachengruppen. Besonnesch d'ISO 8859-1 ass erweiterbar ASCII, dat ass en Dësch fir d'Vereenegte Staaten a Westeuropa. A ISO 8859-5 ass en Dësch fir Cyrillic, och Russesch.

Aus enger Rei historeschen Grënn war de Standard ISO 8859-5 net laang gebraucht.

Fir déi russesch Sprooch am Moment gëtt Kodéierung wierklech benotzt:

  • CP866 (Code Page 866), oder DOS, deen oft Alternativ Zeechesaatz GOST genannt ass. Et gouf aktiv bis zur Mëtt vun den 90er Joren vum leschte Joerhonnert benotzt. Am Moment, bal net benotzt.
  • KOI-8. D'Kodéierung gouf 1970-80er entwéckelt, an am Moment ass et den Standard fir Postmeldungen an der RuNet. Et ass vill am OS vun der Unix Famill, ënner anerem Linux. D'"russesch" Versioun vum KOI-8 gëtt KOI-8R genannt. Zousätzlech ginn et Versioune fir aner kyrillesch Sproochen, zum Beispill ukrainesch.
  • Code Page 1251 (CP 1251, Windows - 1251). Et gouf vum Microsoft Corporation entwéckelt fir russeschsproocheg Ënnerstëtzung an der Windows-Ëmgéigend ze hunn.

Den Haaptvorteil vum éischte Standard CP866 war d'Erhaltung vu pseudographesche Charaktere an déi selwecht Positiounen wéi an der Extensieller ASCII. Dëst erlaabt Iech onverännert Textprogramm, déi auslännesch Produktioun, wéi de berühmte Norton Commander. De Moment gëtt CP866 fir Programmer entwéckelt, déi ënner Windows entwéckelt ginn, déi am Vollbildmodus oder am Textfenster schaffen, dorënner FAR Manager.

Computer-Texter, déi an der CP866-Kodéierung geschriwwe sinn, sinn zimlech rar ginn, awer et gëtt fir russesch Dateinamen an Vindous benotzt.

"Unicode"

Am Moment ass dës Kodéierung am meeschte verbreet. Unicode Codes ginn an Regiounen opgedeelt. Déi éischt (vun U + 0000 bis U + 007F) beinhalt d'Charaktere vum ASCII mat Coden. Follegt dann d'Gebidder vun de Schëlder vun ënnerschiddleche nationalen Scripten, wéi och Punktuatiounspären a technesch Symboler. Zousätzlech ass en Deel vun den Unicode-Codes reservéiert wann et néideg ass, nei Symboler an Zukunft ze beegen.

Dir wësst, datt an der ASCII-Kodéierung all Zeechen als eng Kombinatioun vun 8 Nullen representéiert gëtt. Bei Net-Spezialisten kann dës Informatioun net noutwendeg sinn an net interessant sinn, awer wëlls de net wësse wat "am Gehirn" vun Ärem PC geschitt?

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lb.birmiss.com. Theme powered by WordPress.