XML-native DB. XQuery::Журнал СА 5.2008
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Наука и технологии
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Дата-центры  

Дата-центры: есть ли опасность утечки данных?

Российские компании уже несколько лет испытывают дефицит вычислительных мощностей. Рост числа проектов,

 Читать далее...

Книжная полка  

Защиты много не бывает

Среди книжных новинок издательства «БХВ» есть несколько изданий, посвященных методам социальной инженерии

 Читать далее...

Событие  

В банке рассола ждет сисадмина с полей фрактал-кукумбер

Читайте впечатления о слете ДСА 2024, рассказанные волонтером и участником слета

 Читать далее...

Организация бесперебойной работы  

Бесперебойная работа ИТ-инфраструктуры в режиме 24/7 Как обеспечить ее в нынешних условиях?

Год назад ИТ-компания «Крок» провела исследование «Ключевые тренды сервисного рынка 2023». Результаты

 Читать далее...

Книжная полка  

Читайте и познавайте мир технологий!

Издательство «БХВ» продолжает радовать выпуском интересных и полезных, к тому же прекрасно

 Читать далее...

СУБД PostgreSQL  

СУБД Postgres Pro

Сертификация по новым требованиям ФСТЭК и роль администратора без доступа к данным

 Читать далее...

Критическая инфраструктура  

КИИ для оператора связи. Готовы ли компании к повышению уровня кибербезопасности?

Похоже, что провайдеры и операторы связи начали забывать о требованиях законодательства

 Читать далее...

Архитектура ПО  

Архитектурные метрики. Качество архитектуры и способность системы к эволюционированию

Обычно соответствие программного продукта требованиям мы проверяем через скоуп вполне себе понятных

 Читать далее...

Как хорошо вы это знаете  

Что вам известно о разработках компании ARinteg?

Компания ARinteg (ООО «АРинтег») – системный интегратор на российском рынке ИБ –

 Читать далее...

Графические редакторы  

Рисование абстрактных гор в стиле Paper Cut

Векторный графический редактор Inkscape – яркий представитель той прослойки open source, с

 Читать далее...

День сисадмина  

Учите матчасть! Или как стать системным администратором

Лето – время не только отпусков, но и хорошая возможность определиться с профессией

 Читать далее...

День сисадмина  

Живой айтишник – это всегда движение. Остановка смерти подобна

Наши авторы рассказывают о своем опыте и дают советы начинающим системным администраторам.

 Читать далее...

Виртуализация  

Рынок решений для виртуализации

По данным «Обзора российского рынка инфраструктурного ПО и перспектив его развития», сделанного

 Читать далее...

Книжная полка  

Как стать креативным и востребованным

Издательский дом «Питер» предлагает новинки компьютерной литературы, а также книги по бизнесу

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 6252
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 6955
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 4244
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 3021
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 3815
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 3833
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 6328
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 3178
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 3471
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 7288
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 10655
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 12375
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 14012
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 9137
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 7090
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 5398
Комментарии: 3
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 4627
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 3436
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 3167
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 3411
Комментарии: 0
Рецензия на книгу «MongoDB в действии»

 Читать далее...

02.12.2013г.
Просмотров: 3034
Комментарии: 0
Не думай о минутах свысока

 Читать далее...

Друзья сайта  

 XML-native DB. XQuery

Архив номеров / 2008 / Выпуск №5 (66) / XML-native DB. XQuery

Рубрика: Веб /  Веб

Александр Календарев

XML-native DB. XQuery

В прошлом номере был разговор про XML-native DB, в частности описывалась разработка Института системного программирования XML-native DB Sedna. Для доступа в XML-ориентированных базах данных консорциумом W3C рекомендован язык XQuery. Он является такой же неотъемлемой частью XML-native базы данных, как SQL в реляционных СУБД.

XQuery. Hемного истории

Недавно группа XML консорциума W3C отпраздновала свое десятилетие. Вскоре, после выхода первой спецификации XML, появилась потребность в организации хранения информации в формате XML, и соответственно появилась потребность в разработке алгоритмов и методов ее извлечения. Поэтому было предложено разрабатывать «язык запросов», и уже в сентябре 1998 года появился проект спецификации XQL (XML Query Language, http://www.w3.org/TR/NOTE-xml-ql) – языка запросов для XML. Данная работа шла параллельно с работой группы XPath, которая занималась разработкой спецификации XPath – языка позиционирования XML-узлов (http://www.w3.org/TR/xpath) В связи с тем что разработка обеих групп пересекалась, группа XQL была расформирована, а сама спецификация XQL была признана неудачной.

В августе 1999 года была сформирована группа XQuery в составе 39 человек под руководством Пауля Коттона (Paul Cotton). А группа XPath впоследствии вошла в состав рабочей группы XSL (http://www.w3.org/Style/XSL).

Первые требования спецификации модели данных (Data Model) XQuery вышли в январе 2000 года, а уже в 2001 году опубликовывается проект спецификации описания языка XQuery.

3 ноября 2005 года XQuery 1.0 получил статус W3C Candidate Recommendation, а 23 января 2007 года XQuery 1.0, одновременно с XSLT 2.0 и XPath 2.0, получил статус официальной рекомендации (W3C Recommendation).

В настoящее время ведутся работы по развитию этого стандарта, с добавлением выражений полнотекстового поиска и для внесения изменений в XML-документы и базы данных (XQuery Update), а также для процедурных операций.

Группой XQuery консорциума W3C подготовлены следующие спецификации:

  • XML Path Language (XPath) 2.0;
  • XQuery and XPath Data Model;
  • XQuery and XPath Functions and Operators;
  • XQuery Formal Semantics;
  • XML Query Requirements;
  • XML Query Use Cases;
  • XSLT and XQuery Serialization;
  • XML Syntax for XQuery (XQueryX);
  • XQuery and XPath Full-Text Requirements;
  • XQuery and XPath Full-Text Use Cases.

Сам язык запросов XQuery не был бы так интересен, если бы не появились его практические реализации. На примере Senda мы и рассмотрим, как осуществляется работа с NXD.

XQuery. Основные понятия

В основе XQuery лежит Xpath 2.0. Но с другой стороны, XQuery расширяет абстракцию формирования данных с помощью FLWOR-выражений. Акроним «выражения FLWOR» был назван по первым буквам операторов:

  • for – связывает одну или более переменных, создавая набор кортежей;
  • let – связывает переменные с результатом вычисления выражения;
  • where – осуществляет фильтрацию кортежей по заданному условию;
  • order by – отвечает за сортировку;
  • return – отвечает за создание выходного выражения для данного кортежа.

XQuery вводит понятие «последовательность». Последовательность – это список, содержащий множество объектов или включающий в себя одну или несколько иных последовательностей.

Каждый объект может представлять либо узел, либо атомарное значение.

Под списком узлов понимается множество узлов, выбранных по имени, типу или иному критерию. В отличие от представления XML DOM-модели, модель данных в XQuery представлена в виде дерева узлов. Допускаются следующие типы узлов: документ, элемент, атрибут, текст, пространство имен, команда обработки (process-instruction) и комментарий. Каждый узел считается уникальным, даже если узлы идентичны.

Узлы можно выбрать по Xpath-выражению, например, для выбора всех названий регионов демонстрационной БД аукцион применима следующая конструкция:

Пример 1. Простое использование XPath

doc("auction")/site/regions/*/name()

В результате мы получим следующий список:

africa,asia,australia,europe,namerica,samerica

Использование этого Xpath-выражения аналогично использованию простого оператора:

SELECT * FROM TABLE

Можно средствами Xpath наложить фильтр, например, выбрать все элементы <item>, которые входят в регион «asia»:

Пример 2. Усложненное использование XPath

 doc("auction")/site/regions/*[ name()='asia']/item

Аналогом фильтра в SQL является конструкция WHERE в операторе SELECT, т.е. аналогичное SQL-выражение:

SELECT * FROM TABLE regions WHERE name='asia'

Синтаксис XQuery в своем арсенале имеет выражения FLWOR. Так, пример 1 можно преобразовать следующим образом:

Пример 3. Использование выражений FLWOR

for $reg in doc("auction")/site/regions/*

return $reg/name()

Мы преобразовали запрос, но при этом сами результаты выполнения запроса изменяться не будут.

Использовав запрос из примера 2, с помощью операторов FLWOR его можно преобразовать в следующий вид:

Пример 4. Использование выражений FLWOR

for $reg in doc("auction")/site/regions/*

where $reg/name()='asia'

return $reg/item

В примерах 3 и 4 используется оператор for, синтаксис которого интуитивно понятен и очень похож на оператор цикла в процедурных языках.

Как упоминалось ранее, XQuery так же, как и XSLT, позволяет осуществлять преобразования результата запроса, например, чтобы оформить результат примера 1 в следующий XML-документ:

<region>africa</region>

<region>asia</region>

<region>australia</region>

<region>europe</region>

<region>namerica</region>

<region>samerica</region

 Для этого в выражении return необходимо составить шаблон выходного выражения:

<region>{$reg/name()}</region>

где выражение, заключенное в фигурные скобки {}, вычисляется и осуществляется подстановка. В результате получится следующий запрос:

Пример 5. Использование конструктора выражений

for $reg in doc("auction")/site/regions/*

return <region>{$reg/name()}</region>

Пусть нам необходимо результат запроса из примера 5 заключить в теги <regions>{результат}</regions>, тогда данное преобразование должно принять следующий вид:

Пример 6. Более расширенное использование конструктора выражений

for $reg in doc("auction")/site/regions

 return

 <regions>

 {

for $r in $reg/*

           return <region>{$r/name()}</region>

 }

 </regions>

Как вы видите, с помощью XQuery можно формировать структуру XML-документа и производить практически любую трансформацию выходного документа, наподобие того, как это делается в XSLT. Сам SQL в отличие от XQuery формирует только набор строк.

Упорядочивание выборки

Рассмотрим более сложный пример:

Пример 7. Выборка и упорядочивание

for $reg in doc("auction")/site/regions/*

   return

    <region name="{$reg/name()}">

    {

    for $loc in $reg/item

    order by $loc/location

    return <item location="{$loc/location}" id="{$loc/@id}"/>

    }

    </region>

В примере 7 осуществляется выборка всех лотов по регионам и упорядочивание лотов по расположению лота (значение тега <location>, выражение «order by $loc/location»). Как вы уже догадались, аналогом в SQL является конструкция ORDER BY в операторе SELECT.

Результат выполнения примера 7:

<region name="africa">

 <item location="United States" id="item0"/>

</region>

<region name="asia">

 <item location="Denmark" id="item2"/>

 <item location="United States" id="item1"/>

</region>

<region name="australia">

 <item location="United States" id="item4"/>

 <item location="Uzbekistan" id="item3"/>

</region>

. . .

Группировка

На следующем примере рассмотрим группировку. Выведем всех участников аукциона и страну их проживания:

Пример 8. Группировка

let $person := doc("auction")/site/people/person

for $p in $person

return <person country="{$p/address/country}" >{$p/name/text()}</person>

Первое, на что хочется обратить внимание в примере 8, – это использование последовательности, т.е. присвоение оператором let переменной $person некой последовательности узлов, значение которой определяется Xpath-выражением: «(doc("auction")/site/people/person)».

Далее, для того чтобы сгруппировать всех участников по странам проживания, необходимо выделить последовательность, которая содержит узлы с именем названия стран:

let $country := distinct-values($person/address/country)

Для того чтобы пропустить одноименные узлы, используется функция distinct-values().

Если сравнивать с SQL, то данное выражение аналогично оператору «SELECT DISTINCT …».

Далее все очень просто: проходимся оператором for по всем странам и выбираем имена тех person, которые проживают в данных странах:

Пример 9. Группировка

let $person := doc("auction")/site/people/person 

let $country :=  distinct-values($person/address/country)

for $c in $country return

<country  name="{$c}">

    { for $p in $person[address/country=$c ]

    return

    <person>{$p/name}</person>

}

</country>

Результат:

 

<country name="United States">

  <person>  <name>Huei Demke</name> </person>

  <person>  <name>Daishiro Juric</name> </person>

  . . .

</country>

<country name="Cook Islands">

   <person>  <name>Shooichi Oerlemans</name> </person>

</country>

<country name="Greenland">

   <person>  <name>Nestoras Gausemeier</name> </person>

</country>

 

Конечно, SQL-конструкция:

SELECT name, country FROM table GROUP BY country

выглядит наглядней, но XQuery более гибкий при построении структур данных.

Пересечения и выборки

XQuery не был бы полным языком, если бы с его помощью нельзя было бы делать объединения и пересечения множеств. Пусть нам необходимо выбрать имена всех участников и сгруппировать их по открытым аукционам. По сути, это запрос «SELECT INNER JOIN …». Например, данный запрос выдает только ссылки на имена участников:

Пример 10. Выборка по одному множеству

let $auc := doc("auction")/site/open_auctions

for $a in $auc/open_auction

return

   <auction >{

    for $p in $a/bidder/personref/@person

    return <person>{$p}</person>

   }</auction>

И результат этого запроса необходимо пересечь с запросом:

let $person := doc("auction")/site/people/person

В итоге получаем запрос:

Пример 11. Пересечение выборок

let $auc := doc("auction")/site/open_auctions

let $person := doc("auction")/site/people/person

 for $a in $auc/open_auction

    return

    <auction id="{$a/@id}">{

    for $p in $person[@id = $a/bidder/personref/@person]

    return <person>{$p/name/text()}</person>

    }

    </auction>

Красным цветом выделены изменения. В данном запросе связывающей конструкцией WHERE, аналога SQL, является Xpath-выражение:

$person[@id=$a/bidder/personref/@person]

Хотелось бы отметить необходимость использования функции text() в возвращаемом выражении: $p/name/text(). Функция text() возвращает значение текстового узла name. В противном случае мы получили бы значение всего узла, включая обрамляющие теги:

<person><name>Huei Demke</name></person>

Функцию text() можно заменить на функцию data(), которую необходимо уже применять ко всему Xpath-выражению: data($p/name).

Результаты выполнения нашего запроса (см. пример 11):

 

<auction id="open_auction0">

<person>Huei Demke</person>

<person>Laurian Grass</person>

. . .

</auction>

<auction id="open_auction1">

<person>Jamaludin Kleiser</person>

<person>Eliana Ruemmler</person>

. . .

</auction>

<auction>. . .</auction>

 

Из набора FLWOR-выражений было рассмотрено все, кроме выражения IF. Данному выражению трудно найти аналог в SQL-запросах, хотя его можно сравнить с оператором IF, используемым в хранимых процедурах, но с более ограниченными возможностями.

Пусть нам необходимо выбрать стоимость лотов из всех аукционов, присвоив каждому лоту признак-attribute, в зависимости от цены – small для лотов меньше $30 и normal для всех остальных лотов.

Простейшее решение продемонстрировано в примере 12:

Пример 12. Выборка с условием

let $price := doc("auction")/site/closed_auctions/closed_auction/price

for $p in $price

return

if ( $p < 30 ) then

<lot type="small" >{data($p)}</lot>

else

<lot type="normal" >{data($p)}</lot>

Результат выполнения запроса:

<lot type="normal">62.07</lot>

<lot type="normal">61.60</lot>

<lot type="small">19.59</lot>

<lot type="small">9.41</lot>

<lot type="small">21.75</lot>

 

В отличие от своих собратьев XSLT и SQL XQuery, благодаря включению FLWOR-выражений, более приближен к процедурному языку, и он проще в понимании. Еще больше его приближает наличие в нем функций. Вызов функции состоит из списка выражений, разделенных запятыми, которые являются аргументами функции. В примере 13 показывается обращение к встроенной функции concat() – склеивание строк:

Пример 13. Использование встроенных функций

let $name := doc("auction")/site/regions/*/name()

for $n in $name

return concat( $n, " is region tag")

Однако XQuery не был бы мощным средством, если бы не имел функций, определяемых пользователем. Каждая пользовательская функция, как и в любом процедурном языке, состоит из объявления и тела. Для примера определим функцию inc(), которая увеличивает значение счетчика на 1:

Пример 14. Объявление функции

declare function math:increment($num as xs:decimal) as xs:decimal {

$num + 1

}; 

Следует отметить, что входные и выходные параметры у функций должны быть типизированы. Допускаются как стандартные типы, определенные спецификацией XML Scheme:

  • xs:string
  •  xs:integer
  •  xs:decimal
  •  xs:float
  •  xs:date
  •  xs:QName
  •  xs:anyURI

 Так и простые типы:

  • element
  • node
  • attribute

XQuery также еще позволяет определять пользовательский тип:

define type user {

attribute id of xs:ID

element rating ?

}

Необходимо отметить, что имя функции должно иметь ранее определенный префикс пространства имен (namespace prefix). Под пространством имен понимается идентифицируемая с помощью ссылки URI (RFC2396) коллекция имен, используемых в XML-документах для обозначения типов элементов и именования атрибутов. В данном случае с помощью uri будет идентифицироваться набор имен, определяемых пользователем функций. W3С рекомендовано, чтобы использовался уникальный домен разработчика, например http://mycompany.ru/xquery/fn. Определяется пространство имен выражением:

declare namespace fn="http://nycompany.ru/Sedna/fn";

В случае если пространство имен не объявлено, то должен быть объявлен локальный префикс: local:increment().

Спецификация XQuery не определяет операторы изменения данных в XML-документах. Однако любая БД должна не только извлекать данные из хранилища, но и иметь возможность манипулировать ими. В DML (Data Manipulation Language), являющимся подмножеством SQL, существуют операторы: INSERT. UPDATE и DELETE, выполняющие функции вставка/изменение/удаление. XML-DB-консорциум выступил с инициативой XUpdate и предложил свой синтаксис. Данный синтаксис очень похож на синтаксис операторов DML.

Например, для добавления данных необходимо выполнить следующий запрос:

Пример 15. Выражение Update. Вставка узла

UPDATE

insert <person id="person25">

        <name>John Smith</name>

        <phone>223-322-223-322</phone>

        <creditcard>3454 3656 2344 6767</creditcard>

       </person>

into document("auction")/site/people

А для удаления этих же данных необходимо выполнить запрос:

Пример 16. Выражение Update. Удаление узла

UPDATE

delete document("auction")/site/people/person[name/text()="John Smith"]

Можно выполнить запрос на замену некоторых узлов:

Пример 17. Выражение Update. Замена узла

UPDATE replace

$g in document("auction")/site/people/person[@id="person25"]/name with

<name>Ivanov Ivan</name>

XQuery. Ближе к практике

В одном веб-проекте, который представляет собой интернет-каталог, необходимо собрать информацию с нескольких XML-источников и опубликовать ее на веб-сайте. Сбором информации занимается программа-загрузчик XML-документов, которая вызывается по расписанию. Далее на основе собранных документов строится обобщенный XML-документ. Пусть обобщенная информация имеет следующую структуру (см. рисунок).

Cтруктура обобщенной информации

Cтруктура обобщенной информации

Синим цветом на рисунке изображен иерархический каталог товаров, который определен тегами:

<category id="12" name="пылесосы" … >

Зеленым цветом представлена иерархия товаров, распределенная по брендам.

Например, товар «пылесос THOMAS TWNtt». Пылесос относится к элементу каталога: «Бытовая техника – пылесосы», имеет бренд – марку производителя – THOMAS и является моделью TWNtt. Тег бренда будет:

<brand id="23" name="THOMAS" >

Каждый бренд – множество моделей, каждая из которых описывается тегом item:

<item id="34521" name="TWNtt" category="12”>

<description>описание модели</description>

</item>

Тег <item > имеет атрибут category, который ссылается на элемент каталога (на рисунке это изображено красной стрелкой). По каждой модели есть набор предложений от разных магазинов. Каждое предложение описывается тегом:

<offer price="12500" shop_id="12" url="http://texnoshock.ru/12343" />

Для выбора всех товаров данной категории достаточно сделать следующий запрос:

Пример 18. Запрос на выборку товаров по всей категории «пылесосы»

let $catalog := doc("catalog")/category[@name = "пылесосы"]

let $goods := doc("goods")/brand/item

for $g in $goods

where $catalog/@id = $g/@category

return $g

В нашем примере конструкция WHERE осуществляет связывание элементов документов doc("catalog") и doc("goods") наподобие конструкции WHERE при «джоине» таблиц в SQL. Для поиска конкретного товара по названию достаточно выполнить следующий запрос:

Пример 19. Запрос на выборку товаров по имени товара

let $goods := doc("items2")/goods/brand/item

for $g in $goods

where @name="TWNtt"

return $

Иногда при поиске мы не знаем точного имени, а знаем только часть, тогда можно использовать встроенные строковые функции: fn:contains, fn:start-with, fn:ends-with, fn:substring-before, fn:substring-after:

Пример 20. Запрос на выборку товаров по части имени:

let $goods := doc("items2")/goods/brand/item

for $g in $goods

where fn:contains( $g/@name ,"S80" )

return $g

В заключение хочется отметить, что определенные технологии надо использовать строго по назначению, для чего они разрабатывались. Если в проекте большая часть данных обрабатывается в XML-формате, то и использование специально адаптированных под XML средств даст положительный эффект.

XQuery и WEB

В последнее время хоть и растет популярность использования XML-технологий, но в ближайшее время массового использования XML-native DB в WEB, на мой взгляд, не предвидится. Как говорится, нет спроса – нет и предложения. Соответственно хостеры и не спешат устанавливать XML DB.

Существуют отдельные проекты, которые используют XML-native DB, и число таких проектов постепенно растет. Авторы проекта Sedna реализовали поисковую систему WikiXMLDB (http://wikixmldb.dyndns.org), которая включает 24 Гб информации, собранной в Википедии (http://en.wikipedia.org). Поиск информации осуществляется довольно-таки быстро. В данном проекте использован индекс full-text.

Авторы проекта Sedna для использования построения индекса full-text используют внешний коммерческий компонент dt_search (http://www.dtsearch.com). В ближайшем будущем авторы проекта обещают внедрить внутренний механизм построения индекса full-text.

Использование Sedna в качестве хранилища информации целесообразно в случае работы с XML-документами. Например, в таких проектах, которые интенсивно обмениваются XML-документами или SOAP-сообщениями. Один проект закачивает и обрабатывает из разных источников 600-700 XML-сообщений. В другом известном мне проекте сделан импорт базы данных «1С» – склад в электронный магазин в XML-формате. Но такие проекты – скорее всего исключение, вернее сказать, попытки освоить новые технологии.

Если зашел разговор о технологиях, то, сравнивая с наиболее популярной РСБД MySQL, можно сказать, что по скорости выбора данных Sedna соизмерима с MySQL и даже на некоторых запросах обгоняет его. Чтобы быть более объективным, необходимо добавить, что при тестировании не учитывалась загрузка системы, т.е. тестирование проходило на «чистой» машине.

Надо отметить, что нет методики сравнения XML BD и реляционных БД, поэтому для сравнения были загружены в MySQL и Sedna одни и те же данные. Сравнивалась скорость извлечения однотипных данных.

Скорость выборки данных во многом зависит от правильной организации структуры данных. Надо отметить, что простое копирование структуры таблиц РСБД здесь не подходит и это отдельная тема для статьи. Однако Sedna имеет небольшой недостаток. Это относительно значительное время, необходимое на первоначальную загрузку данных (команда LOAD). Данный недостаток отсекает часть проектов, в использовании которых необходимо оперативно в реальном времени вводить большие объемы XML-данных и сразу же их обрабатывать.

Если сравнивать проекты, то в MySQL хорошо задействованы механизмы кэширования запросов. И если первый запрос выполняется относительно медленно, то все последующие – довольно-таки быстро. Однако механизм кэширования эффективен, если спектр запросов узок. В Sedna кэширование результатов запроса или его части реализовано менее эффективно. Поэтому при сравнении времени исполнения выборок одних и тех же запросов результаты разные, в зависимости от загрузки серверов в данное время другими запросами.

Раз затронута тема WEB, то необходимо упомянуть, что разработчиками проекта был написан модуль mod_sedna для веб-сервера Apache 2.0. Данный модуль позволяет использовать Sedna не только как хранилище, но и как модуль обработки логики.

Используются расширения файлов .xqy и .xquery, заданные по умолчанию. Для обработки этих файлов необходимо в htppd.conf добавить следующие строки:

LoadModule sedna_module modules/mod_sedna.so

LoadModule apreq_module modules/mod_apreq.so

AddHandler sedna-handler .xqy .xquery

В .xqy-файле пишется запрос, результаты которого отдаются сервером веб-клиенту. Раз есть исходный запрос, то должны быть и параметры запроса. Они передаются как тело POST-запроса. Например:

<data><person id=”1”>Alexandre</person></data>

Эти данные доступны в теле запроса как элементы документа request_parameters:

let $id = document("request_parameters")/data/person/@id;

let $name = document("request_parameters")/data/person/text();

 Пара слов о доступе. Sedna – это полноценная БД с разделенным доступом. Все данные соединения содержатся в следующих HTTP-переменных (могут быть как GET, так и POST):

  • se_url – URL на котором запущена Sedna;
  •  se_dbимя БД;
  • se_login – login;
  •  se_passwordпароль.

Не знаю, из каких принципов исходили разработчики, но, на мой взгляд, это является не совсем правильным с точки зрения защиты веб-приложений. Эти данные необходимо прописать либо в конфигурационном файле httpd.conf, либо в тексте xqy-программы.

Один их вариантов использования Sedna – это формирование SOAP-ответа для веб-служб или формирование непосредственно HTML для дальнейшей публикации данных в WEB, например, с использованием mod_sedna.

Чего не хватает в проекте Sedna, так это хорошего инструмента профилирования. При построении и оптимизации запросов можно полагаться только на свою интуицию и здравый смысл. Нет инструмента определения, как быстро исполнилась та или иная часть запроса, какие индексы были задействованы, каково значение промежуточных переменных.

Остается надеяться, что разработчики будут постоянно совершенствовать свой продукт и в скором времени доведут его до конкурентоспособного состояния.

  1. Официальный сайт проекта Sedna – http://modis.ispras.ru/sedna/index.htm.
  2. Sedna Programmer’s Guide. Документация, входящая в дистрибутив.
  3. Консорциум W3C. XQuery – http://www.w3.org/TR/xquery.
  4. XQuery в Википедии – http://ru.wikipedia.org/wiki/XQuery.
  5. XQuery tutorial – http://www.w3schools.com/xquery/default.asp.
  6. XUpdate – http://xmldb-org.sourceforge.net/xupdate/xupdate-wd.html.
  7. Говард Кац. XQuery от экспертов. Кудиц-образ. М. 2005 г.

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru