Кодировки - Вся информация в компьютере хранится в цифровом виде. Т.е., когда вы, например, набираете текст, то на диск пишутся числа, но на экране отображаются буковки.
Как же компьютер понимает, какую буковку показать? А у него есть (внимание термин!) кодовая таблица , где записано, какой буковке какое число соответствует. Когда компьютер отображает вам файл, он смотрит в эту таблицу и видит, что числу (коду) 65 соответствует буква "А" (английская!) и рисует ее нам на экране. Итак, кодовая таблица показывает соответствие между символами и кодами.
А сколько символов, хотите вы спросить, помещается в кодовую таблицу? Отвечаю. Ровно 256. И такая таблица именуется ASCII . Правда, сейчас появилась новая кодовая таблица - UNICODE . И содержит она 65535 символов.
Исторически сложилось так. Первые 127 символов строго определены. Остальные 128 варьируются в зависимости от страны, т.е. могут содержать символы какого-либо национального алфавита (русского там, испанского и т.п.).
Мы пришли к чему? К множеству кодовых страниц, относящихся к различным языкам.
Для русского языка существует несколько кодовых страниц. Причем между собой они несовместимы. Появлялись они постепенно, по мере появления в России той или иной операционной системы.
В MS-DOS русская кодовая страница именовалась DOS-866.
В Windows 3.1/3.11/95/97/98/NT/2000 русская кодовая страница именуется windows-1251.
В операционных системах семейства UNIX есть две русские кодовые страницы: iso-8859-5 и koi8-r.
В операционных системах Macintosh русская кодовая страница именуется x-mac-cyrillic.
Какой следует из всего этого вывод? Текст созданный, допустим с использованием кодовой страницы DOS-866 , вообще говоря не будет читабельным ни под Windows, ни под Macintosh, ни под UNIX.
Существуют, правда программы-перекодировщики, которые умеют переводит текстовый файл из одной русской кодировки в другую. Они бесплатны и общедоступны в сети.
Самые сообразительные уже, должно быть догадались, что обилие кодовых таблиц надо как-то учитывать при создании документов HTML. Правильно. Но и тут не все так просто...
<<назад