Использование Cassandra в системах сбора и анализа данных::Журнал СА 01-02.2016
www.samag.ru
Журнал «БИТ. Бизнес&Информационные технологии»      
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Мобильные приложения  

Искусственный интеллект в мобильных приложениях: возможности и перспективы

Обзор современных применений ИИ в мобильных приложениях, анализ перспектив развития этой технологии,

 Читать далее...

ИТ-образование  

Как сделать ИТ-образование эффективным?

Эксперты ИТ-отрасли отвечают на вопросы «СА». Обсуждаем ключевые аспекты для улучшения образовательных

 Читать далее...

Work-life balance  

Как айтишнику найти баланс между работой и личной жизнью?

Обсуждаем инструменты для эффективного управления временем, снижения уровня стресса и достижения гармонии. На

 Читать далее...

Книжная полка  

Всё самое нужное – под одной обложкой

Отличительная черта книжных новинок, выпущенных недавно издательством «БХВ» – это их универсальность. Не просто

 Читать далее...

ИТ-инфраструктура  

Системы мониторинга ИТ-инфраструктуры-2025

Без мониторинга ИТ-инфраструктуры не обходится ни одна компания, хотя бы потому, что

 Читать далее...

Открытое ПО  

Безопасность Open Source: рискуем или контролируем?

Компания «Кросс технолоджис» изучила, как используется ПО с открытым кодом в компаниях

 Читать далее...

Работа с нейросетью  

Скажи, есть ли у тебя AI, и я скажу, кто ты

Недавно сервис по поиску работы SuperJob выяснил, что каждый второй россиянин уже

 Читать далее...

Опрос  

Защита личных и клиентских данных: как мошенники используют ИИ и как защититься?

По данным RED Security, общее число кибератак на российские компании в 2024

 Читать далее...

Опрос  

Облачные инструменты для разработчиков

Эксперты ИТ-отрасли отвечают на вопросы «Системного администратора» > Как с помощью облака сделать

 Читать далее...

Опрос  

Рынок мобильных приложений: что будет актуальным в 2025 году?

Эксперты ИТ-отрасли отвечают на вопросы «Системного администратора» > Ваши прогнозы: чего ожидать от

 Читать далее...

Рынок труда  

Как успешно пройти все этапы собеседования на ИТ-должность?

По оценкам государства, дефицит ИТ-специалистов составляет от 740 тысяч до 1 миллиона

 Читать далее...

Исследование  

Как искусственный интеллект меняет банковское обслуживание: от чат-ботов до автоматического одобрения кредитов

Искусственный интеллект (AI) всё глубже проникает в банковский сектор, меняя способы обслуживания

 Читать далее...

Спецпроект «Базальт СПО». Развитие Open Source в России  

Алексей Смирнов: «Сейчас трудно найти программный продукт, в котором нет свободного кода»

Какое будущее ждет свободное ПО? Влияет ли свободная или несвободная разработка на

 Читать далее...

Спецпроект «Базальт СПО». Развитие Open Source в России  

Николай Костригин: «Мы создали Hantis, конвейер автоматизации. Проекты, исследуемые разными инструментами, переходят от одного исполнителя к другому, развиваются, возвращаются к автору, и так по кругу»

О том, как идет работа по повышению безопасности отечественного программного обеспечения, рассказывает

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 7980
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 8241
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 5583
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3526
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 4325
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 4325
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6873
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3680
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3950
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7851
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 11197
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12931
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14694
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9630
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7592
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5882
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 5065
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3915
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3601
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3836
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Использование Cassandra в системах сбора и анализа данных

Архив номеров / 2016 / Выпуск №01-02 (158-159) / Использование Cassandra в системах сбора и анализа данных

Рубрика: Базы данных /  Особенности продукта

Александр Календарев АЛЕКСАНДР КАЛЕНДАРЕВ, РБК Медиа, программист, akalend@mail.ru

Использование Cassandra
в системах сбора и анализа данных

В статье рассмотрены плюсы и минусы NoSQL Cassandra на примере использования в системах сбора и анализа данных

Введение в Cassandra

Частой задачей многих специализированных веб-проектов является сбор данных для последующего их анализа. При большом потоке входных данных их сохранение втрадиционных RMDB может стать проблемой. В таких случаях лучше использовать нереляционные БД, которые называют NoSQL (т.е. не SQL БД). Одной из таких NoSQL-систем хранения и является Cassandra.

Cassandra (далее по тексту С*) относится к семейству поколоночных (ColumnFamily) NoSQL-хранилищ данных [1]. Основным свойством данного типа баз данных является быстрая вставка данных. Поэтому рационально их использовать в системах сбора и логирования информации для ее дальнейшего анализа. Второй важной особенностью C* является то, чтоэто кластерное решение, и разработчику не нужно задумываться о масштабировании, все «работает из коробки». По этим двум причинам и рационально ее использовать в системах сбольшим потоком входных данных: баннерные, рекламные или партнерские сети, счетчики интернет-статистики, разного рода телеметрические системы.

Данные в C* хранятся в виде колонок, которые представляются как ключ, значение и время сохранения (timestamp). Сохранность данных осуществляется их дублированием наразные узлы кластера. При настройке кластера нам необходимо задать коэффициент дублирования, еще его называют уровнем репликации.

По умолчанию значение уровня репликации равно трем. Это значит, что одни и те же данные будут храниться на трех разных узлах кластера, и при выходе из строя одного из узлов данные будут взяты с другого узла. C* – это надежное хранилище данных.

В соответствии с теоремой CAP [2] в кластерных распределенных системах одновременно невозможно иметь согласованные и не противоречивые данные. Поэтому при настройке кластера выбираются разные уровни согласованности:

  • QUORUM – данные отдаются на клиент, когда поступят от узлов, в соответствии со значением уровня репликации отдаются самые последние данные, осуществляется сравнение по timestamp.
  • LOCAL_QUORUM – аналог QUORUM, но в пределах кластера.
  • ALL – данные отдаются на клиент, когда поступят от всех узлов, обеспечивается наивысший уровень согласованности, отдаются самые последние данные.
  • ANY – данные отдаются на клиент, когда поступят от любого узла, но все узлы кластера должны быть доступны. Это низкий уровень согласованности.
  • ONE – данные отдаются на клиент, когда поступят от первого отозвавшегося узла.
  • TWO – данные отдаются на клиент, когда поступят от двух отозвавшихся узлов, отдаются самые последние данные, сравнение по timestamp.
  • THREE – аналог TWO, но применительно к трем узлам.

При использовании разных уровней согласованности осуществляется разная скорость отдачи. Самая быстрая – при установке значения уровня согласованности в ONE и самая медленная – при установке в ALL.

Еще одной важной особенностью С* является возможность связи географически разнесенных кластеров, т.е. мы можем связать несколько кластеров, находящихся в разных дата-центрах.

Итак, C* – это высоконадежное, хорошо масштабируемое, распределенное хранилище данных с архитектурой взаимодействия узлов peer-to-peer (каждый с каждым). Оно хорошо подходит для систем сбора информации, так как вставка в традиционные РСУБД, основанные на b-tree, происходит относительно медленно, особенно на больших объемах информации.

Статью целиком читайте в журнале «Системный администратор», №01-02 за 2016 г. на страницах 76-81.

PDF-версию данного номера можно приобрести в нашем магазине.


  1. Календарев А. NoSQL как он есть. // «Системный администратор», №11, 2013 г. – С. 51-55 (http://samag.ru/archive/article/2567).
  2. Календарев А. CAP-дилеммa. Быстро, качественно или дешево? // «Системный администратор», №12, 2013 г. – С. 44-45 (http://samag.ru/archive/article/2589).
  3. Силаков Д. Проект Docker. Управляем виртуальными окружениями. // «Системный администратор», №3, 2015 г. – С. 10-14 (http://samag.ru/archive/article/2887).
  4. Календарев А. Новое в Tarantool. // «Системный администратор», №1-2, 2015 г. – С. 67-71 (http://samag.ru/archive/article/2868).
  5. Календарев А. Кролик в песочнице. // «Системный администратор», №11, 2015 г. – С. 60-65 (http://samag.ru/archive/article/3074).
  6. Сайт проекта Сassandra – http://cassandra.apache.org.
  7. Официальная документация – http://docs.datastax.com/en/cassandra/3.0/cassandra/cassandraAbout.html.
  8. PHP-драйвер для начинающих – https://academy.datastax.com/demos/getting-started-apache-cassandra-and-php.

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru