ComputerenInformatiounen Technik

Kodéierung "Unicode": Charakter coding Norm

All Internet Benotzer an engem Versuch ee bis ageriicht oder den Trainer vun hirer Funktioun op d'mannst seng Chancë eemol op de Bildschierm geschriwwen am Latäin Bréiwer d'Wuert "Unicode." Wat ass et, Iech vun liesen dësem Artikel léieren.

Definitioun

Kodéierung "Unicode" - Zeechesaz Norm. Et war déi Unicode Galaxy Net-Gewënn Organisatioun proposéiert 1991. D'Norm ass entworf an engem Dokument déi gréisst méiglech Zuel vun verschidden Zorte vu Personnagen ze bréngen zesummen. Säit, déi op der Basis gegrënnt gouf zielt, kann Bréiwer a Personnagen enthalen aus verschiddene Sproochen (aus russesch zu Koreanesch) a mathematesch Schëlder. An dësem Fall, all vun de Personnagen am Charakter Formatioun sinn ouni Problemer gewisen.

D'Grënn fir d'Kreatioun vun

Eemol op enger Zäit, laang virun der krut vun engem eenzege System "Unicode" Zeechesaatz baséiert op d'Astellungen vun den Auteur vun der Dokument ausgewielt. Fir dës Grond, oft engem Dokument ze liesen, et war noutwendeg verschidden Dëscher ze benotzen. Heiansdo ass et néideg puer mol ze maachen, wat immens d'Liewen vun der Moyenne Benotzer complicates. Wéi schonn ugeschwat, war d'Léisung fir dëse Problem vun 1991 bis Unicode Galaxy invitéiert engem Net-Gewënn Organisatioun eng nei Zort vun Zeechesaz ze bidden. Et war entworf aktuell an enger Rei vun Standarden ze kombinéieren. "Unicode" - eng Dekodéierungs datt d'unthinkable um Zäit erreechen ozvolila: en Instrument ze schafen, datt eng grouss Zuel vun Zeechen ënnerstëtzt. D'Resultat iwwerschratt vill Erwaardungen - do waren Dokumenter gläichzäiteg souwuel Englesch a Russesch Text, Latäin a mathematesch Ausstralung mat.

Mä d'Kreatioun vun engem vereenegt coding vum brauchen Zousaz enger Zuel vu Problemer ze léisen, datt scho vun Standarden wéinst dem grousse ville Kritiken hunn op déi Zäit bestehend. De stäerkste gemeinsam vun hinnen:

  • Widmung schreiwen, oder "gibberish";
  • d'Aschränkungen vun der Charakter Formatioun;
  • Problem Verännerung codings;
  • Schrëft Verdueblung.

Klengen historeschen excursus

Virstellen, datt d'Haff 80.. Computer Schrauwen ass net sou heefeg an huet eng Form anescht wéi haut. Iwwerdeems all OS ass eenzegaarteg a raffinéiert all spezifesch Besoinen d'Begeeschterten. Brauch fir den Austausch vun Informatiounen ass an eng zousätzlech loossen alles ëmgerechent. Probéiert e Dokument vun anere Betribssystemer System geschafen ze liesen, weist oft eng komesch Formatioun vun Zeechen, an d'Spill fänkt mat der Zeechesaz. Et net ëmmer do ass et séier, an heiansdo néideg Dokument Konnt a sechs Méint opzemaachen, an nach méi spéit. Leit, déi dacks Informatiounsaustausch, schafen fir selwer e Ëmrechnungstabell. An dann Aarbecht op se eng interessant Detail verréid: d'brauchen se an zwou Richtungen ze schafen, "vu mengem an Ärem" zréck an erausbréngen. Maachen festgehalen Stuerz Rechenzäit Maschinn ka net, fir et an der rietser Kolonn vun der Quell, an déi lénks - d'Resultat, mä net verletze kann. Wann Dir de Besoin ze benotzen keng speziell Personnagen am Dokument gesinn, hu si éischt dobäi ze sinn, an dann nach, a fir de Partner ze erklären wat hien zu deene Personnagen ze maachen brauch net eng méi "gibberish." A mer elo net dass vergiessen fir all Zeechesaatz hu souguer hiren eegene Policen entwéckelen oder ëmsetzen, wat fir d'Schafung vun enger riseger Zuel vun Retard an der OS gefouert.

Stellt weider, datt de Policen op der Säit, Dir 10 Stécker vun sëlwecht Times New Roman mat enger klenger Note gesinn gëtt: fir UTF-8, UTF-16, ANSI, UCS-2. Elo verstoen, dass d'Entwécklung vun allgemengt Standarden war Imperativ?

"D'Grënnungsmembere Pappe vun der hannert vun"

D'Originne vun der Kreatioun vun Unicode bis zu 1987 fonnt ginn wann Dzho Bekker aus Xerox, zesumme mat Lee Collins an Mark Davis aus dem Apple ugefaang Fuerschung am Beräich vun praktesch Kreatioun vun engem allgemengt Charakter Formatioun. Am August 1988, publizéiert Dzho Bekker engem Projet Propositioun fir d'Schafung vun 16-bëssen Multi-lingual international coding System.

E puer Méint méi spéit war Unicode Aarbechtsgrupp agesat erweidert ze Ken Whistler a Mike Kernegana aus RLG, Glenn Rayt vun Sun Microsystems an e puer aner Spezialisten, Donnéen der Réalisatioun vun der Aarbecht op der virleefeg Équipe vun enger gemeinsamer coding Norm och.

allgemeng Beschreiwung

D'Unicode baséiert op d'Konzept vun der Symbol. Ënnert dës Definitioun rappeléiert eng mythologesch Phänomen dass duerch eng grapheme (hir "Portraite") an engem bestëmmte Form vun schrëftlechen a realiséiert gëtt. All Charakter ass an der "Unicode" eenzegaarteg Code gehéiert zu engem bestëmmte Eenheet Norm ginn. ZB grapheme B ass och an Englesch a Russesch section, mee et entsprécht Unicode 2 verschiddene Personnagen. Si ënnerleien zu Konversioun ze geschriwen, t. E., all vun deem de Schlëssel Datebank beschreift, eng Rei vun Eegeschaften an déi voll Numm.

Virdeeler vun Unicode

Vun anere Zäitgenosse "Unicode" Zeechesaatz Et ass eng enorme Stock vun Unzeeche fir "Dateverschlësselung" Zeechen. Der Tatsaach, datt säi Virgänger 8 Deeler haten, dat ass déi vun 28 Zeeche ënnerstëtzt, mä den neien Design war schonn 216 Zeechen, dass e risege Schrëtt no vir ass. Dëst erlaabt gerannt bal all déi bestehend a gemeinsam section.

Mat deer vun "Unicode" brauchen net méi eng Ëmrechnungstabell ze benotzen: als eenzeg Standard just et de Besoin fir si gefaart. Den Zerfall, hunn se an Honn goen Raumtransporter, an "gibberish" - engem eenzege Standard hinnen onméiglech gemaach, wéi och Regel aus der musst zweete Policen schafen.

Entwécklung vun Unicode

Natierlech, ass Fortschrëtt net am Plaz, an zanter dem éischte Presentatioun huet fir 25 Joer huet. Allerdéngs charset "Unicode" hält stubbornly seng Positioun an der Welt. A ville Weeër huet dëst méiglech Merci un der Tatsaach gemaach ginn, datt et ganz einfach an huet gefuerdert ginn ass verbreet, gëtt Entwéckler vun propriétaire (bezuelten) an Open Source Software unerkannt.

Mir sollen net datt haut gleewe mir déi selwecht Code "Unicode" wéi de Quartier vun engem Joerhonnert ago gesinn. Am Moment, war et duerch Versioun 5.h.h ersat, an d'Zuel vun kodéiert Zeechen ass bis 231. Op der Méiglechkeet fräi vun benotzt eng grouss Spillraum Mark refuséiert ze nach Ënnerstëtzung erhalen fir Unicode-16 (Zeechesaatz, wou de Maximum Montant vun hirem limitéiert Zuel 216). Zanter hir Departementer a bis zu Versioun 2.0.0 "D'Unicode Standard" huet d'Zuel vun de Personnagen fräi dass et bal an 2 Mol abegraff. Méiglechkeeten a weider Wuesstem an den nächste Joren. Fir Versioun 4.0.0 schonn do ass eng brauchen d'Norm selwer ze klammen, an dat war gemaach. Als Resultat "Unicode" huet fonnt, d'Form wéi mir se haut kennen.

Wat ass anescht an Unicode?

Zousätzlech zu de groussen, permanent mat der Zuel vun de Personnagen aktualiséiert, "Unicode" -Encoding Text Informatiounen ass eng aner nëtzlech recommandéiert. Dat ass de sougenannte normalization. Amplaz vun Charakter ganze Dokument Charakter Minière duerch, an Auswiesselspiller de Symboler vun der Korrespondenz Dësch, benotzen ee vun de bestehend normalization algorithms. Wat ass et?

Amplaz op engem regelméisseg kucken vum selwechte Charakter de Ressourcen vun de Computer vu, déi a verschiddene section ähnlech kann, eng speziell Algorithmus benotzt. Et erlaabt Dir eng ähnlech Symboler separat KOLONN ginnSocket Dësch ze maachen an Demande schon hinnen, net Fäegkeeten ëmmer nees gewisen all déi Daten ze weg.

Esou algorithms sinn entwéckelt a véier ëmgesat. All Konversioun statt vun streng definitive Prinzip, anescht wéi déi aner, also all ee vun hinnen ze ruffen ass net déi efficace méiglech. All fir spezifesch Besoinen entworf, war Ënnerbewosstsinn an erfollegräich benotzt.

Verbreedung Norm

An de 25 Joer vu senger Geschicht Zeechesaatz "Unicode" Ech hu wahrscheinlech am meeschte verbreet an der Welt dobäi. Ënner dëse Standard sinn als Programmer an Web-Säiten ugepasst. D'Breet vun Applikatioun kann soen dass Unicode elo vun méi wéi 60% vun Internet Ressourcen benotzt.

Elo, Dir wësst, wann de "Unicode" Standard wossten. Wat ass et, kennt dir och an kënnen déi voll Bedeitung vun der Erfindung ze appréciéieren, déi vun enger Grupp vun Experten Unicode Galaxy gemaach Méi wéi virun 25 Joer.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lb.birmiss.com. Theme powered by WordPress.