Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2::Журнал СА 5.2014
www.samag.ru
Журнал «БИТ. Бизнес&Информационные технологии»      
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Работа с Debian  

О Linux с любовью или Debian: через знание к любви

Конечно, одним лишь перечислением замечательных качеств любовь к Linux не возникнет. Для

 Читать далее...

Опрос  

Защита личных и клиентских данных: как мошенники используют ИИ и как защититься?

По данным RED Security, общее число кибератак на российские компании в 2024

 Читать далее...

Опрос  

Облачные инструменты для разработчиков

Эксперты ИТ-отрасли отвечают на вопросы «Системного администратора» > Как с помощью облака сделать

 Читать далее...

Опрос  

Рынок мобильных приложений: что будет актуальным в 2025 году?

Эксперты ИТ-отрасли отвечают на вопросы «Системного администратора» > Ваши прогнозы: чего ожидать от

 Читать далее...

Рынок труда  

Как успешно пройти все этапы собеседования на ИТ-должность?

По оценкам государства, дефицит ИТ-специалистов составляет от 740 тысяч до 1 миллиона

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 7608
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 7865
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 5223
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3350
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 4144
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 4156
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6655
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3490
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3771
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7645
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 11010
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12734
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14517
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9454
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7418
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5701
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 4905
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3760
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3440
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3672
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2

Архив номеров / 2014 / Выпуск №5 (138) / Лабораторная работа. Представление текстовой информации в ЭВМ. Часть 2

Рубрика: Карьера/Образование /  Пятая пара

Владимир Закляков ВЛАДИМИР ЗАКЛЯКОВ, советник налоговой службы 2-го ранга, zaklyakov@samag.ru

Лабораторная работа
Представление текстовой информации в ЭВМ. Часть 2

Дополнительные знания по кодированию текстов, практические задания по кодированию русских букв разными кодовыми таблицами, примеры перекодирования

В первой (теоретической) части работы [1] были рассмотрены кодирование текстовой информации и некоторые полезные свойства кодировок.

Разберём несколько вопросов, в меньшей степени относящихся к кодировкам, и перейдём к практической части, где предлагается самостоятельно выполнить несколько заданий посредством общения с компьютером через интерфейс командной строки (CLI). Это должно способствовать закреплению теоретических знаний и получению соответствующих навыков работы в консоли.

Транслитерация

Особняком стоит семибитная русская «кодировка» – транслитерация, или транскириллица, когда русские буквы передаются похожими по звучанию или написанию английскими (primerno takim obrazom). Первоначально такой способ кодирования использовался в первых ПК, привозимых из-за рубежа, когда установить программы русификации не было возможности.

Как правильнее: подбирать буквы по звучанию (например, «ш» – «sh», «ч» – «ch») или схожему начертанию («ш» – «w», «ч» – «4»), ответить сложно, потому как это не стандарт, а очередная придумка наших находчивых граждан, «псеводкодировка». Если при фонетическом соответствии задача написать программу, конвертирующую однозначно тексты «туда» и «обратно», кажется реальной, то при визуальном способе подбора соответствий задача не решается простой заменой.

Вторую жизнь в «псевдокодировку» вдохнули SMS. Максимальный размер сообщения в стандарте GSM – 140 байт (1120 бит) при семибитном кодировании. Поэтому такой способ кодирования можно встретить, когда нужно уложиться в отведённые 160 символов или 140 байт.

При использовании восьмибитной кодировки (например, немецкий и французский языки, где есть точки над буквами (мляуты) и др. значки) можно отправлять сообщения длиной до 140 символов. Для поддержки иных национальных алфавитов (китайского, арабского, русского и др.) используется двухбайтовая (16-битная) кодировка UCS-2.

Таким образом, SMS, написанное кириллицей, не может превышать 70 знаков. В ряде телефонов поддерживаются восьмибитные кодировки кириллицы – KOI8-R и CP1251, но при использовании их возникают проблемы с совместимостью с обычными телефонами, где данных кодовых таблиц нет.

Естественно, при таком выборе кодовой таблицы невозможна отправка сообщений с использованием других алфавитов, кроме кириллицы и латиницы.

В «обществе потребления» корпорациям, предоставляющим услуги сотовой связи, проще переложить дополнительную финансовую нагрузку на плечи абонентов. Вот и получается, что для передачи русских букв аппараты по умолчанию используют невыгодную с точки зрения получаемого конечного размера сообщений кодировку UCS-2. Ответом на эту несправедливость в России были попытки законодательно защитить абонентов, уравняв размеры оплаты за сообщения длиной в 160 символов, независимо от используемого алфавита: кириллицы или латиницы, но они быстро сошли на нет.

Статью целиком читайте в журнале «Системный администратор», №5 за 2014 г. на страницах 86-91.


Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru