Когда евро — не евро

Начинаем новую рубрику «пятиминутка ликбеза с сайтом Таблица символов Юникода»

Сегодня посмотрим на раздел «Управляющие символы С1», к которому относятся символы с кодами от 0080 до 009F. То есть блок, идущий сразу после ASCII (первые 128 символов).

Этот раздел был унаследован Юникодом от кодовой страницы ISO 8859-1. Сама же ISO 8859-1 (также известная, как Latin-1), основана на символьном наборе для терминалов. В следствии чего, первые 32 символа были выделены для различных терминальных команд. То есть, «разрешение разрыва строки», «запрещение разрыва строки», «обратный перевод строки», «символ-заполнитель» и остальной допотопный треш.

На Latin-1 также раньше строились и другие 8-битные кодировки, в частности Windows-1252, использовавшаяся в Windows для западноевропейских алфавитов.

Однако, Microsoft, как всегда, сторонние стандарты использует, но только так, как хочет. Там решили, что в Latin-1 не попали многие нужные и ненужные, но забавные, символы. Например, не попал знак евро (€), что всех очень напрягало, так как цены на сайтах писать не удобно. Зато целых тридцать две позиции занимают какие-то символы для терминалов. Кому они нужны? На терминалах-то и Windows нету.

Остальной текст под катом

Таблица символов Юникода — новые горизонты

А тем временем антисоциальная сеть нового поколения «Таблица символов Юникода» развивается бешеными темпами.

Уже 5 000 пользователей каждый день заходят на сайт с одним им известными целями.

Как показала практика, добавление новых фич и фишек на сайт не даёт никакого прямого эффекта. А вот если просто забросить его на полгода, то посещаемость сразу начинает стабильно расти.

Чтобы как-то сбить этот бурный рост, с которым уже не справляется наш дохленький сервер, мы собираемся в ближайшее время добавить множество новых возможностей.

Из того, что мы успели сделать в последнее время:

1. Таблица символов, наконец, показывает действительно, практически, все символы, а не квадратики. Это достигается использованием нормального шрифта, а не того барахла, которое стоит по умолчанию во всех операционных системах. Чтобы не слишком нагружать пользовательский канал, шрифт подгружается не целиком, а постепенно, нужными частями.

2. Теперь русские названия символов, это, в большинстве своём, действительно, названия. А не треш из гугло-переводчика.

3. Благодаря иностранным волонтёрам у нас теперь есть интерфейс на тайском, китайском и украинском.

4. И ещё много приятных мелочей.

Из того, что запланировано:

1. Добавление следующей плоскости из стандартна, то есть символы после 65 536. На практике, это совершенно бессмысленная мешанина из иконок типа «самолётик» и «домик». Но для сообщений вконтакте самое то.

2. Множество контента с описаниями символов, разделов, алфавитов и много чего ещё.

3. Обучающие статьи.

4. Новые забавные разделы символов.

5. И ещё множество того, чего мы ещё сами не знаем.

Если вы программист, переводчик, лингвист или просто хороший человек и хотите поработать с нами за уважение и большое человеческое спасибо, обращайтесь. Помните, что Таблица символов Юникода — выбор домохозяек со всего мира.