Уникод: Разлика между версии

Изтрито е съдържание Добавено е съдържание
м Bot: Automated text replacement (- , +,)
м →‎Свойство „Обща категория“: Интервалът на младшите сурогатни кодови точки започва от U+DC00, а не от U+DC99.
Етикет: Визуален редактор с уикитекст
Ред 250:
|}
 
Кодовите точки в диапазона между U+D800 и U+DBFF (общо 1024 на брой) се наричат старши '''сурогати''' (''high-surogate code points''], а тези между U+DC99DC00 и U+DFFF (също 1024) – младши сурогати (''low-surrogate code points''). Старши сурогат и следващ го младши сурогат образуват сурогатна двойка, използвана в UTF-16 за представяне на кодовите точки над U+FFFF. Сурогатните кодови точки не могат да се използват по друг начин (това правило често се пренебрегва на практика, особено когато не се използва UTF-16).
 
За определен малък набор от кодови точки се гарантира, че никога няма да се използват за кодиране на знаци, макар че приложенията при желание могат да ги използват вътрешно. Тези '''не-знаци''' (''noncharacters'') са 66 на брой: U+FDD0–U+FDEF и всички кодови точки, завършващи на FFFE или FFFF (например U+FFFE, U+FFFF, U+1FFFE, U+1FFFF, … U+10FFFE, U+10FFFF). Наборът от не-знаци е стабилен и никога няма да се разширява в бъдеще. Както и при сурогатите, правилото, че тези кодови точки не бива да се използват, често се игнорира, макар че за работата на маркера за ред на байтовете (BOM) се приема, че U+FFFE никога няма да бъде първа кодова точка в текст.