Символно кодиране: Разлика между версии

Изтрито е съдържание Добавено е съдържание
Стандарт- формат. грешно в wiki ENG
Ред 34:
'''''Репертоарът от символи''''' предстсвлява абстрактен списък от повече от един милион открити скриптове, включително ''латински, кирилица, китайски, корейски, японски, иврит и арамейски символи.''
 
Други символи като музикалните ноти например, също са включени в символния репертоар. И двата стандартаформата - [[:en:Unicode|Unicode]] и [[:en:GB_18030|GB18030]] имат символен репертоар. Когато нови символи са добавени към един стандартформат, друг стандартформат ги добавя също, с цел да се поддържа подобие на първия.
 
Размерът на кодовата единица се равнява на битовете за конкретния стандартформат на кодиране:
* Кодова единица според [[:en:ASCII|US-ASCII]] стандартаформата се състои от 7 бита;
* Кодова единица според [[:en:UTF-8|UTF-8]], [[:en:EBCDIC|EBCDIC]] и [[:en:GB_18030|GB18030]] стандартаформата се състои от 8 бита;
* Кодова единица според [[UTF-16]] стандартаформата се състои от 16 бита;
* Кодова единица в [[UTF-32]] стандартаформата се състои от 32 бита.
 
'''''Пример за кодова единица:''''' Представете си един '''''String''' (бълг.: низ от символи)'', който съдържа "abc", последван от Deseret LONG I, който е представен с две символни стойности. Този символен низ съдържа четири знака, четири кодови точки, но като цяло '''''пет кодови единици'''''.
 
За да изразите символ (знак) в Unicode, за шестнадесетичната стойност се добавя е началото представка на низа U +. Валидният обхват на кодовата точка за стандартаформата Unicode варира от U + 0000 до U + 10FFFF, включително.
 
Стойността на кодовата точка за латинския символ (знак) А е U ​​+ 0041.
Ред 87:
'''Връзката между кодовите точки и кодовите единици:'''
 
Кодовата точка е символ (знак) и се представя с една или повече кодови единици в зависимост от стандартаформата на кодирането.
 
Кодовите точки се картират в една или повече кодови единици във всеки стандартформат за кодиране.
 
Броят на кодови единици изисква да бъде картиран към кодова точка в зависимост от стандартаформата на кодиране:
* UTF-8
Множеството кодови единици на една кодoва точка са често срещани в UTF-8, поради по-малките размери на кодовите единици. Кодовите точки ще бъдат картирани с една, две, три, или четири кодови единици.