Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2::Журнал СА 5.2014
www.samag.ru
Журнал «БИТ. Бизнес&Информационные технологии»      
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
1001 и 1 книга  
19.03.2018г.
Просмотров: 6828
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 7360
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 4611
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3159
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 3965
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 3967
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6470
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3312
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3591
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7450
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 10814
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12527
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14233
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9263
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7210
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5518
Комментарии: 3
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 4749
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3567
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3276
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3508
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

02.12.2013г.
Просмотров: 3161
Комментарии: 0
Не думай о минутах свысока

 Читать далее...

Друзья сайта  

 Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2

Архив номеров / 2014 / Выпуск №5 (138) / Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2

Рубрика: Карьера/Образование /  Пятая пара

Владимир Закляков ВЛАДИМИР ЗАКЛЯКОВ, советник налоговой службы 2-го ранга, zaklyakov@samag.ru

Лабораторная работа
Представление текстовой информации в ЭВМ. Часть 2

Дополнительные знания по кодированию текстов, практические задания по кодированию русских букв разными кодовыми таблицами, примеры перекодирования

В первой (теоретической) части работы [1] были рассмотрены кодирование текстовой информации и некоторые полезные свойства кодировок.

Разберём несколько вопросов, в меньшей степени относящихся к кодировкам, и перейдём к практической части, где предлагается самостоятельно выполнить несколько заданий посредством общения с компьютером через интерфейс командной строки (CLI). Это должно способствовать закреплению теоретических знаний и получению соответствующих навыков работы в консоли.

Транслитерация

Особняком стоит семибитная русская «кодировка» – транслитерация, или транскириллица, когда русские буквы передаются похожими по звучанию или написанию английскими (primerno takim obrazom). Первоначально такой способ кодирования использовался в первых ПК, привозимых из-за рубежа, когда установить программы русификации не было возможности.

Как правильнее: подбирать буквы по звучанию (например, «ш» – «sh», «ч» – «ch») или схожему начертанию («ш» – «w», «ч» – «4»), ответить сложно, потому как это не стандарт, а очередная придумка наших находчивых граждан, «псеводкодировка». Если при фонетическом соответствии задача написать программу, конвертирующую однозначно тексты «туда» и «обратно», кажется реальной, то при визуальном способе подбора соответствий задача не решается простой заменой.

Вторую жизнь в «псевдокодировку» вдохнули SMS. Максимальный размер сообщения в стандарте GSM – 140 байт (1120 бит) при семибитном кодировании. Поэтому такой способ кодирования можно встретить, когда нужно уложиться в отведённые 160 символов или 140 байт.

При использовании восьмибитной кодировки (например, немецкий и французский языки, где есть точки над буквами (мляуты) и др. значки) можно отправлять сообщения длиной до 140 символов. Для поддержки иных национальных алфавитов (китайского, арабского, русского и др.) используется двухбайтовая (16-битная) кодировка UCS-2.

Таким образом, SMS, написанное кириллицей, не может превышать 70 знаков. В ряде телефонов поддерживаются восьмибитные кодировки кириллицы – KOI8-R и CP1251, но при использовании их возникают проблемы с совместимостью с обычными телефонами, где данных кодовых таблиц нет.

Естественно, при таком выборе кодовой таблицы невозможна отправка сообщений с использованием других алфавитов, кроме кириллицы и латиницы.

В «обществе потребления» корпорациям, предоставляющим услуги сотовой связи, проще переложить дополнительную финансовую нагрузку на плечи абонентов. Вот и получается, что для передачи русских букв аппараты по умолчанию используют невыгодную с точки зрения получаемого конечного размера сообщений кодировку UCS-2. Ответом на эту несправедливость в России были попытки законодательно защитить абонентов, уравняв размеры оплаты за сообщения длиной в 160 символов, независимо от используемого алфавита: кириллицы или латиницы, но они быстро сошли на нет.

Статью целиком читайте в журнале «Системный администратор», №5 за 2014 г. на страницах 86-91.


Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru