Рубрика:
Разработка /
Веб-технологии
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
АЛЕКСАНДР КАЛЕНДАРЕВ, программист, РБК Медиа, akalend@mail.ru
Индексы в MongoDb
Изучая особенности СУБД MongoDb, нельзя не отметить такой важный момент, как индексирование. Правильное построение индексов и оптимизация запросов определяют общую производительность системы
Прежде чем говорить об индексировании, уточним, что такое «индекс».
«Индекс (англ. index) – объект базы данных, создаваемый в целях повышения производительности поиска данных. Таблицы в базе могут иметь большое количество строк, которые хранятся в произвольном порядке, и их поиск по заданному критерию путем последовательного просмотра таблицы строка за строкой может занимать много времени.
Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет искать строки, удовлетворяющие критерию поиска. Ускорение работы с использованием индексов достигается в первую очередь за счет того, что индекс имеет структуру, оптимизированную под поиск, – например, сбалансированного дерева. Как мы уже поняли из определения, индексы нужны для уменьшения времени выборки, что увеличивает производительность БД. В большинстве случаев переход на разные NoSQL-решения связан именно с недостаточной производительностью традиционных РСУБД.» (Wikipedia.org)
Наиболее производительная выборка документов будет в том случае, если на поля, по которым планируется осуществлять критерий выбора, наложить индекс. Это дает возможность более быстрого выбора за счет использования индекса, который ограничивает нам набор данных для их дальнейшей фильтрации и упорядочивания.
Внутреннее устройство индекса
Как устроен индекс? Это внутренняя таблица в БД, которая имеет два столбца: упорядоченные значения выражения, содержащего необходимые для идентификации поля конкретной записи, и адрес области на носителе, где элементы данных этой записи.
Рассмотрим, как устроен индекс, на примере работы службы знакомств. Нам необходимо найти всех девушек в возрасте от 25 до 35 лет, используя следующие данные (см. таблицу 1). Индекс по полю «возраст» («age») будет выглядеть следующим образом (см. рис. 1).
Таблица 1. Данные зарегистрированных пользователей
sex |
city_id |
age |
name |
offset |
0 |
77 |
35 |
Михаил |
0xA01 |
1 |
78 |
19 |
Мария |
0xA20 |
1 |
78 |
21 |
Лилия |
0xA2C |
0 |
77 |
31 |
Евгений |
0xA04 |
1 |
77 |
26 |
Елена |
0xA24 |
1 |
77 |
31 |
Ольга |
0xA02 |
1 |
78 |
31 |
Вероника |
0xA2A |
Рисунок 1. Индекс по полю «возраст» («age»)
Подходящие данные по нашему критерию – возраст от 25 до 35 лет – обведены красной линией. Далее выбираются документы со смещениями 0xA24, 0xA24, 0xA02, 0xA2A и фильтруются на выборку по критерию sex=1 (не забыли, выбираем только девушек). Как мы видим, вместо полного перебора по всему диапазону коллекции мы отобрали по индексу только соответствующих по возрасту и далее отфильтровали их по критерию пол (sex). Документ со смещением 0xA04 не вошел в результирующее множество (помечен серо-розовым цветом), так как не удовлетворяет критерию: sex=1.
Статью целиком читайте в журнале «Системный администратор», №1-2 за 2014 г. на страницах 94-97.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|