www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Мониторинг  

Какая задача мониторинга отнимает больше всего времени?

Многие системные администраторы тратят до 30% рабочего времени на рутину мониторинга. Но

 Читать далее...

Рынок труда  

Какие навыки вы хотите развивать в 2026 году?

Рынок труда меняется быстро. Еще вчера его называли рынком соискателей, а сегодня

 Читать далее...

Книжная полка  

От сисадмина до архитектора: книги, которые прокачают ваш стек в этом году

Новинки от издательства «БХВ» отличаются тем, что в них часто делается упор

 Читать далее...

Автоматизация  

Автоматизируем рутину: что реально работает?

Многие сисадмины автоматизировали что-то за последний год. Но далеко не все остались

 Читать далее...

Защита ИТ-системы  

Практическая защита: что вы внедрили и что мешает?

Какие меры безопасности реально внедрить в реальных условиях – и что не

 Читать далее...

Вопрос-ответ  

Обеспечиваем безопасную эксплуатацию базы данных

Что для вас чаще всего является причиной инцидентов с БД? Как вы

 Читать далее...

Книжная полка  

От «безопасного» Linux до Контролируемого взлома

Издательство «БХВ» продолжает радовать читателей интересными новинками и в наступившем году. Вы можете

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 13324
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 13438
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 10892
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 5824
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 6675
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 6550
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 9403
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 6004
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 6227
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 10374
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 13824
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 15297
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 17613
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 12477
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 10480
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 8687
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 7291
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 6096
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 5727
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 6044
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Кэшируем динамический контент

Архив номеров / 2008 / Выпуск №8 (69) / Кэшируем динамический контент

Рубрика: Администрирование /  Администрирование

Виталий Банковский

Кэшируем динамический контент

Продолжая цикл статей, я расскажу, как можно создавать кэширующие сервера для динамического контента. (Первую статью цикла «Создаем распределенную сеть доставки контента» см. в №2 за 2008 г.)

Немного о кэшировании

Сейчас на рынке работают несколько компаний, предоставляющих услуги по кэшированию и доставке контента. Но все они, насколько мне известно, имеют один существенный недостаток – неумение достоверно кэшировать динамический контент. Часть из них вообще не может кэшировать динамический контент, а часть обновляют локальный кэш страниц только периодически, что непригодно для страниц социальных сетей. И, как я подозреваю, причина одна – для того чтобы построить акселератор, который бы хранил достоверную копию динамической страницы, необходима плотная интеграция с оригинальным сайтом.

Технология кэширования динамических страниц

Здесь я не изобрету ничего нового, лишь применю стандартные средства протокола HTTP для построения акселератора. В целом вся система состоит из сервера-акселератора и оригинального сайта и работает по следующей схеме:

  • Пользователь обращается к акселератору, который является проксирующим сервером по отношению к сайту.
  • Если акселератор не имеет локальной копии страницы, то он обращается на сайт за ней, отдает страницу пользователю и сохраняет в локальном кэше.
  • Если акселератор уже имеет эту страницу, то он отправляет запрос на оригинальную страницу с заголовком If-Modified-Since xxx, где xxx – дата последней модификации страницы, сохраненной в кэше.
  • Когда оригинальный сайт получает такой запрос, он сравнивает дату модификации своей страницы с этой датой.
  • Если страница уже была модифицирована, то отдается полная версия страницы.
  • Если дата последней модификации такая же, как в кэше, то сайт должен отдать пустую страницу со статусом HTTP 304.
  • Когда кэш получает ответ со статусом HTTP 304, то он отдает страницу из локального кэша.

Компоненты системы

Для построения такой системы я использовал модуль mod_accel Игоря Сысоева [2]. На данный момент идет активная разработка такого же модуля для nginx, но на момент написания этой статьи он еще не был готов.

Установка и настройка

В свой работе я использую CentOS семейства Redhat, поэтому описание процедуры устоновки и настройки будет ориентировано на этот дистрибутив. Первым делом необходимо получить библиотеку EAPI, которая нужна для компиляции модуля mod_accel. Ее можно скачать с сайта [3]. Библиотеку устанавливать не нужно.

tar -xzvf mod_ssl-2.8.4-1.3.20.tar.gz

cd mod_ssl-2.8.4-1.3.20

./configure —with-apache=../apache-1.3.20

make

Далее получаем версию Apache 1.3.20 c cайта [4] и раскрываем архив:

tar -xzvf apache_1.3.20.tar.gz

Также нужна библиотека MM, которая доступна на сайте [5].

tar zxf mm-1.2.1.tar.gz

cd mm-1.2.1

./configure

make

make install

Получаем модуль mod_accel и запускаем процесс обновления исходных кодов Apache:

tar -xzvf mod_accel-1.0.34.tar.gz

cd ./configure \

--with-apache=../apache_1.3.20 \

--with-eapi=../mode_ssl-2.8.4-1.3.20/pkg.eapi

make # накладывает патчи

Далее собираем Apache и устанавливаем:

cd apache_1.3.20

EAPI_MM=../mm-1.2.1 ./configure —enable-rule=EAPI \

--activate-module=src/modules/accel/libaccel.a

make

make install

Настройка Apache

Затем настраиваем Apache для кэширования нашего сайта. Сосредоточимся на основных моментах конфигурационного файла сервера Apache:

# Путь, где будут храниться закэшированнные файлы. Уровень иерархии каталогов — 1

AccelCacheRoot /home/dcache 1

 

# Включить кэширование

AccelNoCache off

 

# Начальный URL и адрес оригинального сайта

AccelPass / http://10.10.10.11:80/

 

# Отключить удаление файлов из кэша

AccelUnlinkNoCached off

 

# Передавать в переменной X-Host переменную среды Host, пришедшей на акселератор.

AccelSetXHost on

 

# Включить передачу IP-адреса посетителя через переменную X-Real-IP нашему сайту

AccelSetXRealIP on

 

# Включить передачу оригинального URL нашему сайту через переменную X-URL

AccelSetXURL on

Перед запуском сервера Apache необходимо создать каталог для хранения страниц кэша и поменять владельца и группу, чтобы процесс apache мог записывать кэш в этот каталог:

mkdir /home/dcache

chown -R apache.apache /home/dcache

Если процесс apache работает под другим именами пользователя и группы, то нужно соответственно поменять параметры команды chown.

Включение запуска сервера Apache в процедуру начальной загрузки сервера состоит в создании файла /etc/init.d/apache со следующим содержимым:

#!/bin/sh

# chkconfig: 2345 55 25

case "$1" in

    start)

        echo -n "Starting: apache"

                /usr/local/apache/bin/apachectl start

        echo "."

    ;;

    stop)

        echo -n "Stopping service: apache"

                killall httpd

        echo "."

    ;;

    restart)

        $0 stop

        sleep 2

        $0 start

    ;;

 

    *)

        echo "Usage: /etc/init.d/apache {start|stop|restart}" >&2

        exit 1

    ;;

esac

 

exit 0

Запускаем наш акселератор:

/etc/init.d/apache start

Интеграция динамической части сайта с акселератором

Статические элементы сайта будут успешно кэшироваться и без специальных настроек. Для того чтобы динамические страницы нашего сайта могли быть закэшированы, необходимо ввести проверку даты последней модификации страниц в кэше с датами последней модификации страниц. Для этого я модифицировал наш сайт таким образом, что каждая страница имеет дату последней модификации, хранимой в базе данных. Когда на сайт передается запрос из акселератора на какую-то страницу, сайт сравнивает дату из заголовка if-modified-since с датой последнего обновления страницы, и в зависимости от результатов проверки скрипт на сайте возвращает или полную версию страницы с кодом HTTP, равным 200, или пустую страницу с кодом 304.

Также обязательно нужно обратить внимание на страницы, которые никогда не должны быть кэшированы. Например, страницы авторизации, обновления учетных записей пользователей и так далее.

К сожалению, такая плотная интеграция зависит от программного обеспечения на сайте, поэтому в качестве примера целесообразно привести упрощенный пример скрипта сайта, проинтегрированного с акселератором:

Листинг 1. Пример программы сайта

<?php
 

$cache=1;
 

# Проверяем, пришел ли к нам запрос из акселератора с заголовком If-modified-since.

# Если такой заголовок существует, это означает, что акселератор имеет локальную копию

# этой страницы

 

if ($_SERVER['HTTP_IF_MODIFIED_SINCE'])

{

    $txt = "cache";

    $len = strlen($txt);

 

    # print 304 code

    header("Status: 304",false,304);

    header("Content-Type: text/html",false,304);

 

    # Печатаем длину контента, иначе акселератор решит что контент — динамический

    # и не закэширует страницу

    header("Content-Length: $len",false,304);

 

    # Печатаем дату последней модификации страницы

    header("Last-Modified: Tue, 16 Oct 2007 12:45:26 GMT",false,304);

    header("Pragma: cache", false,304);

    header("Cache-Control: cache",false,304);

    header("Content-Length: $len",false,304);

 

 

    # Дата, когда документ считается устаревшим, должна быть будущей,

    # иначе акселератор не сохранит страницу

 

    $dt=time();

    $dt+=1;

    header("Expires: " . gmdate("D, d M Y H:i:s",$dt) . " GMT");

    echo $txt;

    exit;

}

else

{

    # В этой секции мы будем генерировать некэшируемый контент или контент,

    # который еще не закэширован в акселераторе

 

    $content = get_some_content();

 

    # Вычисляем длину содержимого, иначе акселератор

    # решит, что это – динамический контент

 

    $len = strlen($content);

    header("Status: 200");

    header("Content-Type: text/html");

    header("Content-Length: $len");

 

    # Печатаем дату последней модификации страницы

    header("Last-Modified: Tue, 16 Oct 2007 12:45:26 GMT");

 

    # Также у нас есть глобальная переменная. При генерации страниц

    # для некэшируемых страниц нужно выставить эту переменную равной нулю

 

    if($cache>0)

    {

           # Указываем акселератору, что нужно кэшировать контент

           header("Pragma: cache");

           header("Cache-Control: cache");

    }

    else{

           # Указываем акселератору что не нужно кэшировать контент

           header("Pragma: no-cache");

           header("Cache-Control: no-cache");

    }

 

    # Как и раньше, устанавливаем дату устаревания документа

    $dt=time();

    $dt+=1;

    header("Expires: " . gmdate("D, d M Y H:i:s",$dt) . " GMT");

 

    # Печатаем контент

    echo $content;

    exit;}

 

?>

 Схема работы приложения может быть построена следующим образом:

  • В начале программы переменная $cache устанавливается в 1.
  • Проверяется наличие заголовка if-modified-since и сравнивается с датой последнего обновления запрошенной страницы. В зависимости от результата проверки переменная $cached устанавливается в 0 или 1.
  • Во всех процедурах динамической генерации контента проверяется значение переменной $cached. Если переменная равна 1, то все эти процедуры завершаются, и программа переходит в финальную фазу – генерация контента как показано выше. Если переменная равна 0, то программа создает контент с нуля.
  • Во всех процедурах, где создается некэшируемый контент, переменная $cache устанавливается равной 0.
  • Вызывается процедура печати контента (как показано выше в примере).

Заключение

В этой статье я рассмотрел основные принципы построения акселератора для кэширования динамического контента. За рамками статьи остался способ, позволяющий дополнительно ускорить систему кэширования через хранение дат последней модификации страниц в одной из наиболее быстрых систем хранения данных – memcached.

  1. Банковский В. Создаем распределенную сеть доставки контента. //Системный администратор, №2, 2008 г. – С. 64-68. – http://www.samag.ru/cgi-bin/go.pl?q=articles;n=02.2008;a=01.
  2. http://sysoev.ru/mod_accel.
  3. http://www.modssl.org.
  4. http://apache.org.
  5. http://www.engelschall.com/sw/mm.
  6. http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html.
  7. http://www.danga.com/memcached.

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru