UTF-32: Разлика между версии

Изтрито е съдържание Добавено е съдържание
мРедакция без резюме
TedMBot (беседа | приноси)
м →‎Анализ: правопис
Ред 11:
Въпреки че фиксиран брой бита за кодова точка е удобно, не е толкова полезно колкото изглежда. Това прави орязването по-лесно, но не значително в сравнение с UTF-8 и UTF-16 (и при двата формата може да се търси точка за съкращаване в обратен ред гледайки по 2 – 4 кодови единици).
 
Изключително рядко е даден код да намери N-тата точка без предварително разглеждане на точките от 0 до N – 1. Това означава, че индекс увеличен с 1 за всеки знак може да бъде заменен с изместеното число, измерено в кодови единици и увеличено с броя кодови единици, като всеки знак се разглежда. Това премахва всички предимства със скоростта при работа с UTF-32. В малкото случаи, където точката N е генерирана без предварително преглеждане на кода, като хеширане и високоскоростни алгоритми за търсене, няма нужда N да бъде представена с точност и по този начин, с орязване, може да бъде пригодено за работа с UTF-8 или UTF-16, чрез настройване на позицията до най-близката граница на кодова точка, операция с фиксирано време. UTF-32 не пресмята показаната ширина на низа по-лесно, тъй като дори и при шрифт с „фиксирана ширина“ може да има знаци, съдържащи повече от една кодова точка на позиция (комбинирани знаци) или повече от един знак на дадена позиция – например CJK (китайски, японски, корейски) йероглифи. Редактори, които се ограничават до езици с начин на изписване от ляво на дяснонадясно и по-сложни знаци, могат да се възползват от фиксираните по размер кодови единици, но е малко вероятно да поддържат знаци, които не са част от BMP и за това работят еднакво добре с UTF-16 кодиране.
 
== Употреба ==