Символно кодиране: Разлика между версии
Изтрито е съдържание Добавено е съдържание
Vodnokon4e (беседа | приноси) форматиране: 6x кавички, 6x тире, 3x тире-числа, 2x интервал, 2x нов ред, 28 интервала, 6lokavica, заглавие-стил (ползвайки Advisor) |
Vodnokon4e (беседа | приноси) мРедакция без резюме |
||
Ред 2:
== История ==
Ранните примери за двоично кодиране включват Шифърът на Бейкън
Морзовата азбука е въведена през 40-те години на 19 век и се използва за кодиране на буквите от латинската азбука, арабските числа и някои символи. Осъществява се посредством серии от кратки и продължителни натискания на телеграфния ключ – тирета и точки.
Ред 35:
'''''Репертоарът от символи''''' предстсвлява абстрактен списък от повече от един милион открити скриптове, включително ''латински, кирилица, китайски, корейски, японски, иврит и арамейски символи.''
Други символи като музикалните ноти например, също са включени в символния репертоар. И двата формата – [[
Размерът на кодовата единица се равнява на битовете за конкретния формат на кодиране:
* Кодова единица според [[
* Кодова единица според [[
* Кодова единица според [[UTF-16]] формата се състои от 16 бита;
* Кодова единица в [[UTF-32]] формата се състои от 32 бита.
Ред 49:
Символи, които са в диапазона от U + 10 000 до U + 10FFFF се наричат допълващи знаци (англ.: ''[http://www.i18nguy.com/surrogates.html supplementary characters]'')
Наборът от символи от U + 0000 до U + FFFF понякога се отнасят до Основната
Таблицата по-долу демонстрира примери за стойности на кодови точки:
Ред 110:
UTF-16 кодовите единици са два пъти по-големи от 8-битовите кодови единици. Ето защо, всички кодови точки със скаларна стойност по-малка от 10 000 U + е кодирана с единична кодова единица.
За кодовите точки със скаларна стойност U + 10 000 или по-висока, са необходими две кодови единици за една кодова точка. За тези двойки кодови единици съществува уникален термин в UTF-16: [[
* '''''UTF-32'''''
32-битовата кодова единица, използвана в UTF-32 е достатъчно голяма, за да позволява на всяка кодова точка да се кодира като единична кодова единица.
Ред 118:
== Уникод кодиращ модел ==
'''[[Уникод]]''' или ''Универсален набор от символи'' (на английски: ''Unicode'') и паралелния му стандарт [[
''Символното съдържание'' е пълният набор от абстрактни символи, които една система поддържа. Съдържанието може да бъде затворено, т.е. не са позволени допълнения без създаване на нови стандарти (както е направена [[
''Кодирания символен низ'' отговаря на това как е представено съдържанието на символите като цели числа, наречени кодови точки. Като например в дадено съдържание, символ представен с главна буква „А“, в латинската азбука е представен като числото 65.
|