www.samag.ru
Журнал «БИТ. Бизнес&Информационные технологии»      
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Интеграция Open Source-решений  

Open Source в облачной среде

Облачные решения становятся всё более популярными в мире. Компании стремятся использовать их для

 Читать далее...

Автоматизация  

Нейросеть вам в руки! Как использовать ИИ для автоматизации задач

Использование ИИ для автоматизации задач помогает компании получить конкурентное преимущество, поскольку объединение

 Читать далее...

Рынок труда  

Специалист по этическому ИИ, инженер по квантовым вычислениям или аналитик по метавселенной?

Новые тенденции в развитии ИТ могут привести к возникновению новых специальностей в

 Читать далее...

Книжная полка  

Учитесь убеждать и побеждать

Издательство «БХВ», как всегда, порадовало своих читателей хорошими книжными новинками. Кроме популярных

 Читать далее...

Сетевая инфраструктура  

Как удаленная работа меняет подход к сетевой инфраструктуре?

С увеличением числа сотрудников, работающих из дома, организации сталкиваются с необходимостью создания

 Читать далее...

Мониторинг  

Какой мониторинг нужен сегодня?

По мнению экспертов ГК InfoWatch, действия сотрудников – самая распространенная причина инцидентов

 Читать далее...

Книжная полка  

Руководство для тех, кто увлечен ИИ, программированием. И дизайном

Накануне лета издательство «БХВ» выпустило книжные новинки, от которых любителям чтения будет

 Читать далее...

Мобильные приложения  

Искусственный интеллект в мобильных приложениях: возможности и перспективы

Обзор современных применений ИИ в мобильных приложениях, анализ перспектив развития этой технологии,

 Читать далее...

ИТ-образование  

Как сделать ИТ-образование эффективным?

Эксперты ИТ-отрасли отвечают на вопросы «СА». Обсуждаем ключевые аспекты для улучшения образовательных

 Читать далее...

Work-life balance  

Как айтишнику найти баланс между работой и личной жизнью?

Обсуждаем инструменты для эффективного управления временем, снижения уровня стресса и достижения гармонии. На

 Читать далее...

Книжная полка  

Всё самое нужное – под одной обложкой

Отличительная черта книжных новинок, выпущенных недавно издательством «БХВ» – это их универсальность. Не просто

 Читать далее...

ИТ-инфраструктура  

Системы мониторинга ИТ-инфраструктуры-2025

Без мониторинга ИТ-инфраструктуры не обходится ни одна компания, хотя бы потому, что

 Читать далее...

Открытое ПО  

Безопасность Open Source: рискуем или контролируем?

Компания «Кросс технолоджис» изучила, как используется ПО с открытым кодом в компаниях

 Читать далее...

Работа с нейросетью  

Скажи, есть ли у тебя AI, и я скажу, кто ты

Недавно сервис по поиску работы SuperJob выяснил, что каждый второй россиянин уже

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 9639
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 9801
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 7222
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 4500
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 5305
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 5308
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 7982
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 4667
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 4916
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 8949
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 12388
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 13928
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 15699
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 10573
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 8600
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 6810
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 5953
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 4872
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 4529
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 4751
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Кэшируем динамический контент

Архив номеров / 2008 / Выпуск №8 (69) / Кэшируем динамический контент

Рубрика: Администрирование /  Администрирование

Виталий Банковский

Кэшируем динамический контент

Продолжая цикл статей, я расскажу, как можно создавать кэширующие сервера для динамического контента. (Первую статью цикла «Создаем распределенную сеть доставки контента» см. в №2 за 2008 г.)

Немного о кэшировании

Сейчас на рынке работают несколько компаний, предоставляющих услуги по кэшированию и доставке контента. Но все они, насколько мне известно, имеют один существенный недостаток – неумение достоверно кэшировать динамический контент. Часть из них вообще не может кэшировать динамический контент, а часть обновляют локальный кэш страниц только периодически, что непригодно для страниц социальных сетей. И, как я подозреваю, причина одна – для того чтобы построить акселератор, который бы хранил достоверную копию динамической страницы, необходима плотная интеграция с оригинальным сайтом.

Технология кэширования динамических страниц

Здесь я не изобрету ничего нового, лишь применю стандартные средства протокола HTTP для построения акселератора. В целом вся система состоит из сервера-акселератора и оригинального сайта и работает по следующей схеме:

  • Пользователь обращается к акселератору, который является проксирующим сервером по отношению к сайту.
  • Если акселератор не имеет локальной копии страницы, то он обращается на сайт за ней, отдает страницу пользователю и сохраняет в локальном кэше.
  • Если акселератор уже имеет эту страницу, то он отправляет запрос на оригинальную страницу с заголовком If-Modified-Since xxx, где xxx – дата последней модификации страницы, сохраненной в кэше.
  • Когда оригинальный сайт получает такой запрос, он сравнивает дату модификации своей страницы с этой датой.
  • Если страница уже была модифицирована, то отдается полная версия страницы.
  • Если дата последней модификации такая же, как в кэше, то сайт должен отдать пустую страницу со статусом HTTP 304.
  • Когда кэш получает ответ со статусом HTTP 304, то он отдает страницу из локального кэша.

Компоненты системы

Для построения такой системы я использовал модуль mod_accel Игоря Сысоева [2]. На данный момент идет активная разработка такого же модуля для nginx, но на момент написания этой статьи он еще не был готов.

Установка и настройка

В свой работе я использую CentOS семейства Redhat, поэтому описание процедуры устоновки и настройки будет ориентировано на этот дистрибутив. Первым делом необходимо получить библиотеку EAPI, которая нужна для компиляции модуля mod_accel. Ее можно скачать с сайта [3]. Библиотеку устанавливать не нужно.

tar -xzvf mod_ssl-2.8.4-1.3.20.tar.gz

cd mod_ssl-2.8.4-1.3.20

./configure —with-apache=../apache-1.3.20

make

Далее получаем версию Apache 1.3.20 c cайта [4] и раскрываем архив:

tar -xzvf apache_1.3.20.tar.gz

Также нужна библиотека MM, которая доступна на сайте [5].

tar zxf mm-1.2.1.tar.gz

cd mm-1.2.1

./configure

make

make install

Получаем модуль mod_accel и запускаем процесс обновления исходных кодов Apache:

tar -xzvf mod_accel-1.0.34.tar.gz

cd ./configure \

--with-apache=../apache_1.3.20 \

--with-eapi=../mode_ssl-2.8.4-1.3.20/pkg.eapi

make # накладывает патчи

Далее собираем Apache и устанавливаем:

cd apache_1.3.20

EAPI_MM=../mm-1.2.1 ./configure —enable-rule=EAPI \

--activate-module=src/modules/accel/libaccel.a

make

make install

Настройка Apache

Затем настраиваем Apache для кэширования нашего сайта. Сосредоточимся на основных моментах конфигурационного файла сервера Apache:

# Путь, где будут храниться закэшированнные файлы. Уровень иерархии каталогов — 1

AccelCacheRoot /home/dcache 1

 

# Включить кэширование

AccelNoCache off

 

# Начальный URL и адрес оригинального сайта

AccelPass / http://10.10.10.11:80/

 

# Отключить удаление файлов из кэша

AccelUnlinkNoCached off

 

# Передавать в переменной X-Host переменную среды Host, пришедшей на акселератор.

AccelSetXHost on

 

# Включить передачу IP-адреса посетителя через переменную X-Real-IP нашему сайту

AccelSetXRealIP on

 

# Включить передачу оригинального URL нашему сайту через переменную X-URL

AccelSetXURL on

Перед запуском сервера Apache необходимо создать каталог для хранения страниц кэша и поменять владельца и группу, чтобы процесс apache мог записывать кэш в этот каталог:

mkdir /home/dcache

chown -R apache.apache /home/dcache

Если процесс apache работает под другим именами пользователя и группы, то нужно соответственно поменять параметры команды chown.

Включение запуска сервера Apache в процедуру начальной загрузки сервера состоит в создании файла /etc/init.d/apache со следующим содержимым:

#!/bin/sh

# chkconfig: 2345 55 25

case "$1" in

    start)

        echo -n "Starting: apache"

                /usr/local/apache/bin/apachectl start

        echo "."

    ;;

    stop)

        echo -n "Stopping service: apache"

                killall httpd

        echo "."

    ;;

    restart)

        $0 stop

        sleep 2

        $0 start

    ;;

 

    *)

        echo "Usage: /etc/init.d/apache {start|stop|restart}" >&2

        exit 1

    ;;

esac

 

exit 0

Запускаем наш акселератор:

/etc/init.d/apache start

Интеграция динамической части сайта с акселератором

Статические элементы сайта будут успешно кэшироваться и без специальных настроек. Для того чтобы динамические страницы нашего сайта могли быть закэшированы, необходимо ввести проверку даты последней модификации страниц в кэше с датами последней модификации страниц. Для этого я модифицировал наш сайт таким образом, что каждая страница имеет дату последней модификации, хранимой в базе данных. Когда на сайт передается запрос из акселератора на какую-то страницу, сайт сравнивает дату из заголовка if-modified-since с датой последнего обновления страницы, и в зависимости от результатов проверки скрипт на сайте возвращает или полную версию страницы с кодом HTTP, равным 200, или пустую страницу с кодом 304.

Также обязательно нужно обратить внимание на страницы, которые никогда не должны быть кэшированы. Например, страницы авторизации, обновления учетных записей пользователей и так далее.

К сожалению, такая плотная интеграция зависит от программного обеспечения на сайте, поэтому в качестве примера целесообразно привести упрощенный пример скрипта сайта, проинтегрированного с акселератором:

Листинг 1. Пример программы сайта

<?php
 

$cache=1;
 

# Проверяем, пришел ли к нам запрос из акселератора с заголовком If-modified-since.

# Если такой заголовок существует, это означает, что акселератор имеет локальную копию

# этой страницы

 

if ($_SERVER['HTTP_IF_MODIFIED_SINCE'])

{

    $txt = "cache";

    $len = strlen($txt);

 

    # print 304 code

    header("Status: 304",false,304);

    header("Content-Type: text/html",false,304);

 

    # Печатаем длину контента, иначе акселератор решит что контент — динамический

    # и не закэширует страницу

    header("Content-Length: $len",false,304);

 

    # Печатаем дату последней модификации страницы

    header("Last-Modified: Tue, 16 Oct 2007 12:45:26 GMT",false,304);

    header("Pragma: cache", false,304);

    header("Cache-Control: cache",false,304);

    header("Content-Length: $len",false,304);

 

 

    # Дата, когда документ считается устаревшим, должна быть будущей,

    # иначе акселератор не сохранит страницу

 

    $dt=time();

    $dt+=1;

    header("Expires: " . gmdate("D, d M Y H:i:s",$dt) . " GMT");

    echo $txt;

    exit;

}

else

{

    # В этой секции мы будем генерировать некэшируемый контент или контент,

    # который еще не закэширован в акселераторе

 

    $content = get_some_content();

 

    # Вычисляем длину содержимого, иначе акселератор

    # решит, что это – динамический контент

 

    $len = strlen($content);

    header("Status: 200");

    header("Content-Type: text/html");

    header("Content-Length: $len");

 

    # Печатаем дату последней модификации страницы

    header("Last-Modified: Tue, 16 Oct 2007 12:45:26 GMT");

 

    # Также у нас есть глобальная переменная. При генерации страниц

    # для некэшируемых страниц нужно выставить эту переменную равной нулю

 

    if($cache>0)

    {

           # Указываем акселератору, что нужно кэшировать контент

           header("Pragma: cache");

           header("Cache-Control: cache");

    }

    else{

           # Указываем акселератору что не нужно кэшировать контент

           header("Pragma: no-cache");

           header("Cache-Control: no-cache");

    }

 

    # Как и раньше, устанавливаем дату устаревания документа

    $dt=time();

    $dt+=1;

    header("Expires: " . gmdate("D, d M Y H:i:s",$dt) . " GMT");

 

    # Печатаем контент

    echo $content;

    exit;}

 

?>

 Схема работы приложения может быть построена следующим образом:

  • В начале программы переменная $cache устанавливается в 1.
  • Проверяется наличие заголовка if-modified-since и сравнивается с датой последнего обновления запрошенной страницы. В зависимости от результата проверки переменная $cached устанавливается в 0 или 1.
  • Во всех процедурах динамической генерации контента проверяется значение переменной $cached. Если переменная равна 1, то все эти процедуры завершаются, и программа переходит в финальную фазу – генерация контента как показано выше. Если переменная равна 0, то программа создает контент с нуля.
  • Во всех процедурах, где создается некэшируемый контент, переменная $cache устанавливается равной 0.
  • Вызывается процедура печати контента (как показано выше в примере).

Заключение

В этой статье я рассмотрел основные принципы построения акселератора для кэширования динамического контента. За рамками статьи остался способ, позволяющий дополнительно ускорить систему кэширования через хранение дат последней модификации страниц в одной из наиболее быстрых систем хранения данных – memcached.

  1. Банковский В. Создаем распределенную сеть доставки контента. //Системный администратор, №2, 2008 г. – С. 64-68. – http://www.samag.ru/cgi-bin/go.pl?q=articles;n=02.2008;a=01.
  2. http://sysoev.ru/mod_accel.
  3. http://www.modssl.org.
  4. http://apache.org.
  5. http://www.engelschall.com/sw/mm.
  6. http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html.
  7. http://www.danga.com/memcached.

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru