UTF-8: Разлика между версии

9 байта изтрити ,  преди 5 години
м
форматиране: 1x А|А(Б)
Редакция без резюме
м (форматиране: 1x А|А(Б))
UTF-8 е най-използваният стандарт за кодиране в [[Уеб|световната мрежа (World Wide Web)]]. Използван е при създаването на 86.6% от всички интернет страници към м. септември 2015 год.<ref>[[:en:Mark_Davis_(Unicode)|Davis, Mark]]&nbsp;(28 January 2010).&nbsp;[https://googleblog.blogspot.bg/2010/01/unicode-nearing-50-of-web.html "Unicode nearing 50% of the web"].&nbsp;''Official [[Гугъл|Google]] Blog''.&nbsp;Google. Retrieved&nbsp;5 December&nbsp;2010.</ref><ref>van der Poel, Erik (8 May 2008).&nbsp;[http://www.w3.org/QA/2008/05/utf8-web-growth#c139948 "utf-8 Growth On The Web (response)"].&nbsp;''W3C Blog''. W3C. Retrieved&nbsp;6 August&nbsp;2015.</ref><ref>[http://w3techs.com/technologies/overview/character_encoding/all "Usage Statistics of Character Encodings for Websites, (updated daily)"]. W3Techs. Retrieved&nbsp;18 September&nbsp;2015.</ref><ref>[http://trends.builtwith.com/encoding/UTF-8 "UTF-8 Usage Statistics"]. BuiltWith. Retrieved&nbsp;28 March&nbsp;2011.</ref>&nbsp;[[:en:Internet_Mail_Consortium|The&nbsp;Internet Mail Consortium&nbsp;(IMC)]] препоръчва във всички програми поддържащи електронна поща (e-mail) да бъде заложена възможност за изобразяване и създаване на електронни съобщения, използващи UTF-8 кодиране.<ref>[http://www.imc.org/mail-i18n.html "Using International Characters in Internet Mail"]. Internet Mail Consortium. 1 August 1998. Retrieved&nbsp;8 November&nbsp;2007.</ref>&nbsp;[[:en:World_Wide_Web_Consortium|W3C]]&nbsp;препоръчва UTF-8 да бъде използвано като стандартно кодиране при работа с&nbsp;[[XML]]&nbsp;и [[HTML]].
 
Чрез UTF-8 се кодира всяка от 1 112 064 на брой валидни кодови точки в Unicode кодовото пространство (1 114 112 кодови точки общо минус 2 048 заместващи кодови точки), като се използват от един до четири 8-битови [[Байт|байтабайт]]а (група от 8 бита се нарича октет ([[:en:Octet_(computing)|octet]]) при Unicode стандарта). Кодови точки с по-малки числови стойности (т.е. по-рано създадени кодови позиции в Unicode символното множество, които се очаква да бъдат използвани по-често) се кодират с по-малко на брой байтове. Първите 128 символа от Unicode, които съответстват на ASCII кода, се кодират с един октет със същата бинарна стойност както при ASCII кодирането, като по този начин всеки валиден ASCII текст в същото време е и валиден UTF-8-кодиран Unicode текст. При UTF-8, байтовете с бинарни стойности, използвани за кодиране на ASCII символи не се използват при кодирането на не-ASCII кодови точки. Поради тази причина UTF-8 кодирането може безопасно да се използва при повечето програмни езици и документи, които интерпретират определени ASCII символи по специфичен начин, например като обозначение за край на символен низ.
 
== Източници ==
562 695

редакции