Уникод: Разлика между версии

Изтрито е съдържание Добавено е съдържание
→‎Уникод групи и блокове: (заедно с предишната редакция:) Допълнения и подобрено оформление на таблицата, смислови корекции на превода.
→‎Главна символна категория: Добавена липсващата таблица със стойности на свойството „Обща категория“. Смислови корекции на превода.
Ред 158:
Във всяка група символите са разпределени в блокове от логически свързани символи. Въпреки че блоковете са с произволен размер, броят кодови точки в тях винаги е кратен на 16, а често и на 128. Знаците, необходими за дадена писменост, може да са пръснати в няколко различни блока.
 
=== Свойство „Обща категория“ ===
=== Главна символна категория ===
Всяка кодова точка има определено свойство от„Обща категория“ ({{Lang-en главната|General категорияCategory}}). Основните категории са: буква, знак, число, пунктуация, символ, разделител и друго. Във всякаВсяка от тези категории има по-малки категорииподразделения. ГлавнатаВ категорияповечето не е подходящаслучаи за ежедневноточно ползване,задаване тъйхарактеристиките катона се използват множество характеристики за всякададена кодова точка. Честое трябванеобходимо да се използват и други свойства за определяне на характеристиките и поведението на дадена кодова точка. Възможните главниобщи категории са:
 
{|class="wikitable sortable collapsible {{{state|collapsed}}}" style="width:100%; margin:0;"
'''Главна категория'''
! colspan=6 style="border:1px solid grey; line-height:1.75em;" |Обща категория <small>(свойство на знаците в Уникод)</small> {{navbar|Обща категория (Уникод)|mini=1|style=float:left;padding:2px;}}
|-
! Стойност !! Категория главна, второстепенна !! Основен тип !! Назначен знак !! Брой {{nowrap|(във версия 10.0)}} !! Бележки
|-
!&nbsp;
!
!
!
!
!
|-
|colspan=6 data-sort-value="000" style="font-weight:bold" |Буква (letter)
|-
|data-sort-value="001" |Lu ||Буква, горен регистър ||Графика ||Знак || 1702 ||
|-
|data-sort-value="002" |Ll ||Буква, долен регистър ||Графика ||Знак || 2063 ||
|-
|data-sort-value="003" |Lt ||Буква, заглавен регистър ||Графика ||Знак || 31 ||[[Лигатура (типография)|Лигатури]], съдържащи главна буква, последвана от малка (напр. [[Dž]], [[Lj]], [[Nj]], and [[Dz]])
|-
|data-sort-value="004" |Lm ||Буква, модификатор ||Графика ||Знак || 250 ||
|-
|data-sort-value="005" |Lo ||Буква, друга ||Графика ||Знак || 121 047 ||
|-
|colspan=6 data-sort-value="010" style="font-weight:bold" |Знак (mark)
|-
|data-sort-value="011" |Mn ||Знак, не интервал ||Графика ||Знак || 1763 ||
|-
|data-sort-value="012" |Mc ||Знак, комбиниращ интервал ||Графика ||Знак || 401 ||
|-
|data-sort-value="013" |Me ||Знак, ограждащ ||Графика ||Знак || 13 ||
|-
|colspan=6 data-sort-value="020" style="font-weight:bold" |Число (number)
|-
|data-sort-value="021" |Nd ||Число, десетична цифра ||Графика ||Знак || 590 ||Всички, и само те, имат свойство „Числов тип“ = De
|-
|data-sort-value="022" |Nl ||Число, буква ||Графика ||Знак || 236 ||Числа, съставени от буквоподобни знаци (напр. [[римски цифри]])
|-
|data-sort-value="023" |No ||Число, друго ||Графика ||Знак || 676 ||Например [[Дроб|обикновени дроби]], цифри в [[горен индекс]] и [[долен индекс]]
|-
|colspan=6 data-sort-value="030" style="font-weight:bold" |Пунктуация (punctuation)
|-
|data-sort-value="031" |Pc ||Пунктуация, свързваща ||Графика ||Знак || 10 ||Включва "_" ([[долна черта]])
|-
|data-sort-value="032" |Pd ||Пунктуация, тире ||Графика ||Знак || 24 ||Включва няколко различни [[тире]]та
|-
|data-sort-value="033" |Ps ||Пунктуация, отваряща ||Графика ||Знак || 75 ||Отварящи [[скоби]]
|-
|data-sort-value="034" |Pe ||Пунктуация, затваряща ||Графика ||Знак || 73 ||Затварящи скоби
|-
|data-sort-value="035" |Pi ||Пунктуация, начална кавичка ||Графика ||Знак || 12 ||Отваряща [[кавичка]]. Не включва "неутралните" кавички от ASCII. Може да се държи като Ps или Pe в зависимост от употребата.
|-
|data-sort-value="036" |Pf ||Пунктуация, завършваща кавичка ||Графика ||Знак || 10 ||Затваряща кавичка. Може да се държи като Ps или Pe в зависимост от употребата.
|-
|data-sort-value="037" |Po ||Пунктуация, друга ||Графика ||Знак || 566 ||
|-
|colspan=6 data-sort-value="040" style="font-weight:bold" |Символ (symbol)
|-
|data-sort-value="041" |Sm ||Символ, математически ||Графика ||Знак || 948 ||Математически символи (напр. [[+]], [[=]], [[×]], [[÷]], [[√]], [[∊]]). Не включва скоби – те са в категориите Ps и Pe. Също не включва [[Удивителен знак|!]], [[Звездичка|*]], [[Минус|-]] и [[Наклонена черта|/]], които въпреки честата си употреба в математиката се смятат основно за „пунктуация“.
|-
|data-sort-value="042" |Sc ||Символ, валутен ||Графика ||Знак || 54 ||Валутни символи
|-
|data-sort-value="043" |Sk ||Символ, модификатор ||Графика ||Знак || 121 ||
|-
|data-sort-value="044" |So ||Символ, друг ||Графика ||Знак || 5855 ||
|-
|colspan=6 data-sort-value="050" style="font-weight:bold" |Разделител (separator)
|-
|data-sort-value="051" |Zs ||Разделител, интервал ||Графика ||Знак || 17 ||Включва интервал, но не и знак за табулация, връщане на каретката (CR) и нов ред (LF), които са Cc.
|-
|data-sort-value="052" |Zl ||Разделител, ред ||Формат ||Знак || 1 ||Само U+2028, LINE SEPARATOR
|-
|data-sort-value="053" |Zp ||Разделител, абзац ||Формат ||Знак || 1 ||Само U+2029, PARAGRAPH SEPARATOR
|-
|colspan=6 data-sort-value="060" style="font-weight:bold" |Други
|-
|data-sort-value="061" |Cc ||Друг, контролен ||Контролен ||Знак || 65 (никога няма да се промени) ||Без име, <control>
|-
|data-sort-value="062" |Cf ||Друг, форматиращ ||Формат ||Знак || 151 ||Включва [[меко тире]], свързващи контролни знаци ([[несъединител с ширина нула|zwnj]] and [[съединител сширина нула|zwj]]), контролни знаци за [[двупосочен текст]] и знаци за отбелязване на език.
|-
|data-sort-value="063" |Cs ||Друг, сурогатен ||Сурогат ||Не (абстрактен) || 2048 (никога няма да се промени) ||Без име, <surrogate>
|-
|data-sort-value="064" |Co ||Друг, частно използване ||Частно използване ||Не (абстрактен) || Общо 137 468 (никога няма да се промени) ({{nowrap|6400 в BMP}}, 131 068 {{nowrap|в групи 15&ndash;16}}) ||Без име, <private-use>
|-
|rowspan=2 data-sort-value="065" |Cn ||rowspan=2 |Друг, недефиниран ||Не знак ||Не || 66 (никога няма да се промени) ||Без име, <noncharacter>
|-
|Запазен||Не|| 837 775 ||Без име, <reserved>
|}
 
Кодовите точки в диапазона между U+D800 и U+DBFF (1,0241024 кодови точки) са известни още като високо заместими кодови точки,  а кодовите точки в диапазона между U+DC99 и U+DFFF (1,024 кодови точки) са известни като слабо заместими кодови точки. Високо заместима кодова точка (известна още като водещ заместител) следвана от слабо заместима кодова точка (известна още като заместител последовател) формират двойка, използвана в UTF-16 за представяне на 1,048,576 кодови точки извън BMP. Високите и слабо заместимите кодови точки не са валидни по отделно. Поради тази причина обхватът на кодовите точки, достъпни за ползване като символи е между U+0000..U+D7FF и U+E000..U+10FFFF (1,112,064 кодови точки). Стойността на тези кодови точки понякога се отнася като скаларна величина.
 
Някои кодови точки, които не съдържат символи не могат да се използват за шифроване на символи, въпреки че съществуват програми, които вътрешно могат да използват тези кодови точки. Съществуват 66 кодови точки без символи: U+FDD0..U+FDEF и всяка кодова точка, завършваща със стойност FFFE до FFFF (например U+FFFE, U+FFFF, U+1FFFE, U+1FFFF, … U+10FFFe, U+10FFFF).