Символно кодиране: Разлика между версии
Изтрито е съдържание Добавено е съдържание
Стандарт- формат. грешно в wiki ENG |
|||
Ред 34:
'''''Репертоарът от символи''''' предстсвлява абстрактен списък от повече от един милион открити скриптове, включително ''латински, кирилица, китайски, корейски, японски, иврит и арамейски символи.''
Други символи като музикалните ноти например, също са включени в символния репертоар. И двата
Размерът на кодовата единица се равнява на битовете за конкретния
* Кодова единица според [[:en:ASCII|US-ASCII]]
* Кодова единица според [[:en:UTF-8|UTF-8]], [[:en:EBCDIC|EBCDIC]] и [[:en:GB_18030|GB18030]]
* Кодова единица според [[UTF-16]]
* Кодова единица в [[UTF-32]]
'''''Пример за кодова единица:''''' Представете си един '''''String''' (бълг.: низ от символи)'', който съдържа "abc", последван от Deseret LONG I, който е представен с две символни стойности. Този символен низ съдържа четири знака, четири кодови точки, но като цяло '''''пет кодови единици'''''.
За да изразите символ (знак) в Unicode, за шестнадесетичната стойност се добавя е началото представка на низа U +. Валидният обхват на кодовата точка за
Стойността на кодовата точка за латинския символ (знак) А е U + 0041.
Ред 87:
'''Връзката между кодовите точки и кодовите единици:'''
Кодовата точка е символ (знак) и се представя с една или повече кодови единици в зависимост от
Кодовите точки се картират в една или повече кодови единици във всеки
Броят на кодови единици изисква да бъде картиран към кодова точка в зависимост от
* UTF-8
Множеството кодови единици на една кодoва точка са често срещани в UTF-8, поради по-малките размери на кодовите единици. Кодовите точки ще бъдат картирани с една, две, три, или четири кодови единици.
|