Уникод: Разлика между версии
Изтрито е съдържание Добавено е съдържание
→Главна символна категория: Добавена липсващата таблица със стойности на свойството „Обща категория“. Смислови корекции на превода. |
|||
Ред 159:
=== Свойство „Обща категория“ ===
Всяка кодова точка има свойство „Обща категория“ ({{Lang-en |General Category}}). Основните категории са: буква, комбиниращ или ограждащ знак, число, пунктуация, символ, разделител и друго. Всяка от тези категории има подразделения. В повечето случаи за точно задаване характеристиките на дадена кодова точка е необходимо да се използват и други свойства. Възможните общи категории са:
{|class="wikitable sortable collapsible {{{state|collapsed}}}" style="width:100%; margin:0;"
! colspan=6 style="border:1px solid grey; line-height:1.75em;" |Обща категория <small>(свойство на знаците в Уникод)</small> {{navbar|Обща категория (Уникод)|mini=1|style=float:left;padding:2px;}}
|-
! Стойност !! Категория: главна, второстепенна !! Основен тип !!
|-
!
Ред 175:
|colspan=6 data-sort-value="000" style="font-weight:bold" |Буква (letter)
|-
|data-sort-value="001" |Lu ||Буква, горен регистър ||
|-
|data-sort-value="002" |Ll ||Буква, долен регистър ||
|-
|data-sort-value="003" |Lt ||Буква, заглавен регистър ||
|-
|data-sort-value="004" |Lm ||Буква, модификатор ||
|-
|data-sort-value="005" |Lo ||Буква, друга ||
|-
|colspan=6 data-sort-value="010" style="font-weight:bold" |
|-
|data-sort-value="011" |Mn ||Знак, не интервал ||
|-
|data-sort-value="012" |Mc ||Знак, комбиниращ интервал ||
|-
|data-sort-value="013" |Me ||Знак, ограждащ ||
|-
|colspan=6 data-sort-value="020" style="font-weight:bold" |Число (number)
|-
|data-sort-value="021" |Nd ||Число, десетична цифра ||
|-
|data-sort-value="022" |Nl ||Число, буква ||
|-
|data-sort-value="023" |No ||Число, друго ||
|-
|colspan=6 data-sort-value="030" style="font-weight:bold" |Пунктуация (punctuation)
|-
|data-sort-value="031" |Pc ||Пунктуация, свързваща ||
|-
|data-sort-value="032" |Pd ||Пунктуация, тире ||
|-
|data-sort-value="033" |Ps ||Пунктуация, отваряща ||
|-
|data-sort-value="034" |Pe ||Пунктуация, затваряща ||
|-
|data-sort-value="035" |Pi ||Пунктуация, начална кавичка ||
|-
|data-sort-value="036" |Pf ||Пунктуация, завършваща кавичка ||
|-
|data-sort-value="037" |Po ||Пунктуация, друга ||
|-
|colspan=6 data-sort-value="040" style="font-weight:bold" |Символ (symbol)
|-
|data-sort-value="041" |Sm ||Символ, математически ||
|-
|data-sort-value="042" |Sc ||Символ, валутен ||
|-
|data-sort-value="043" |Sk ||Символ, модификатор ||
|-
|data-sort-value="044" |So ||Символ, друг ||
|-
|colspan=6 data-sort-value="050" style="font-weight:bold" |Разделител (separator)
|-
|data-sort-value="051" |Zs ||Разделител, интервал ||
|-
|data-sort-value="052" |Zl ||Разделител, ред ||
|-
|data-sort-value="053" |Zp ||Разделител, абзац ||
|-
|colspan=6 data-sort-value="060" style="font-weight:bold" |Други
Ред 239:
|data-sort-value="061" |Cc ||Друг, контролен ||Контролен ||Знак || 65 (никога няма да се промени) ||Без име, <control>
|-
|data-sort-value="062" |Cf ||Друг, форматиращ ||
|-
|data-sort-value="063" |Cs ||Друг, сурогатен ||
|-
|data-sort-value="064" |Co ||Друг, частно използване ||Частно използване ||Не (абстрактен) || Общо 137
|-
|rowspan=2 data-sort-value="065" |Cn ||rowspan=2 |Друг, недефиниран ||Не знак ||Не || 66 (никога няма да се промени) ||Без име, <noncharacter>
|-
|Запазен||Не|| 837
|}
Кодовите точки в диапазона между U+D800 и U+DBFF (общо 1024
За определен малък набор от кодови точки се гарантира, че никога няма да се използват за кодиране на знаци, макар че приложенията при желание могат да ги използват вътрешно. Тези '''не-знаци''' (''noncharacters'') са 66 на брой: U+FDD0–U+FDEF и всички кодови точки, завършващи на FFFE или FFFF (например U+FFFE, U+FFFF, U+1FFFE, U+1FFFF, … U+10FFFE, U+10FFFF). Наборът от не-знаци е стабилен и никога няма да се разширява в бъдеще. Както и при сурогатите, правилото, че тези кодови точки не бива да се използват, често се игнорира, макар че за работата на маркера за ред на байтовете (BOM) се приема, че U+FFFE никога няма да бъде първа кодова точка в текст.
Като изключим сурогатите и не-знаците, остават 1 111 998 достъпни за употреба кодови точки.
* Private Use Area: U+E000–U+F8FF (6400 знака)
* Supplementary Private Use Area-A: U+F0000–U+FFFD (65 534 знака)
* Supplementary Private Use Area-B: U+100000–U+10FFFD (65 534 знака)
'''Графичните'''
▲Графичните символи са символи, които са семантични и имат видима [[глиф]] форма или представляват видимо празно място.
'''Форматиращите''' знаци са такива, които не се виждат сами по себе си, но може да влияят върху вида или поведението на съседните. Например U+200C (несъединител с нулева ширина, zwnj) и U+200D (съединител с нулева ширина, zwj) служат за променяне на подразбираната форма на съседни знаци (в частност потискане на лигатурите или налагане на лигатура). В Уникод 10.0 има 153 форматиращи знака.
Шейсет и пет кодови точки (U+0000–U+001F и U+007F–U+009F) са запазени като '''контролни''' кодове, отговарящи на дефинираните в [[ISO/IEC 6429]] групи от контролни кодове C0 и C1. Кодовете U+0009 (знак за табулация, ''Tab''), U+000A (нов ред, ''Line Feed'') и U+000D (връщане на каретката, ''Carriage Return'') се използват широко в текстове, кодирани с Уникод. На практика кодовите точки от групата C1 често представляват неправилно преобразувани знаци от остарялата кодировка [[CP-1252]], използвана в някои текстове на английски и западноевропейски езици в Windows.
Графичните, форматиращите, контролните и частните знаци се наричат общо ''присвоени знаци'' (''assigned characters''). '''Запазени''' (''reserved'') са тези кодови точки, които са достъпни за използване, но още не са присвоени. В Уникод 10.0 има 873 775 запазени кодови точки.
=== Абстрактни символи ===
|