ДМИТРИЙ РЕПИН
Transparent proxy. Быть или не быть?
Весь текст этой статьи является исключительно личным мнением автора и не претендует на сборник аксиом. Все описанные в статье исследования и выводы также следует рассматривать через призму субъективности автора, ибо, как говорили древние мудрецы, «Errare humanum est». Также автор не несёт ответственности за любые действия (и их последствия), произведённые читателем после прочтения этой статьи.
Лирическое отступление
Работа системного администратора неразрывно связана с программированием. Только наличие знаний в области разработки программ может помочь при решении проблем с программным обеспечением, ибо анализ является частью решения. Специалист обязан чётко представлять себе внутренние механизмы работы системы, а это приходит только с опытом в написании и, что более важно, модификации ПО.
Системы семейства UNIX-подобных являются величайшим источником знаний для самообразования и полигоном для экспериментов. Открытость исходного кода системы и прикладного ПО, низкоуровневый доступ к настройкам и их гибкость... – всё это позволяет глубже вникнуть в принципы работы компьютерных систем и сетей. Кроме того, это позволяет создавать всевозможные нестандартные конфигурации привычного программного обеспечения. Для чего это нужно? В первую очередь для того, чтобы расширить возможности системы. Вторым аргументом в пользу подобных «хирургических вмешательств» в ПО является наличие различных ошибок при разработке программного обеспечения.
Данная статья посвящена проблемам прозрачного проксирования на примере популярного сервера Squid. В качестве ОС использовалась стабильная версия FreeBSD 4.7.
Общие принципы прозрачного проксирования
При работе прокси-сервера в прозрачном режиме (Trans-parent mode) для веб-доступа пользователей в Интернет не требуется настраивать браузер для взаимодействия с прокси на каждом рабочем месте, а сами пользователи могут вообще не знать о существовании прокси-сервера. В таком режиме администраторы и техники получают меньше вопросов и жалоб от пользователей по настройке пользовательского ПО.
Технически этот режим реализуется следующим образом. С помощью firewall все соединения на определённый порт (в случае HTTP – порт 80) внешних серверов перенаправляются на локальный порт прокси-сервера (обычно – 3128).
По стандарту протокола HTTP 1.1 (RFC2616) каждый запрос клиента должен содержать заголовок «Host», в котором указывается адрес сервера-получателя запроса. Именно с помощью этого заголовка прокси-сервер определяет адресата и соединяется с ним. Что же касается других популярных протоколов (FTP, HTTPS, и т. д.), то такой возможности в них просто не предусмотрено. На этой «весёлой ноте» можно начать описание проблем.
Авторизация
Авторизация на прокси-сервере позволяет производить учёт работы и разграничение доступа в Интернет пользователей локальной сети, используя их имена (логины) независимо от того, за каким компьютером находится пользователь и какой адрес имеет данный компьютер. В противном случае администратор имеет возможность контролировать работу сотрудников только на основе IP-адресов, что позволяет пользователям обходить ограничения. Таким образом, авторизация на прокси-сервере является необходимым элементом инфраструктуры локальной сети. А теперь о грустном: авторизация на «прозрачном» прокси-сервере практически невозможна. Однако подобное утверждение явно противоречит стандартам.
Обратимся к первоисточнику – описанию протокола HTTP – документу RFC2616. По стандарту, HTTP-клиент при получении статуса-ответа сервера с кодом 407 (Proxy Authentication Required) обязан отправить данные авторизации серверу. Для иллюстрации работы и для тестов автором был написан небольшой http-сервер на языке Perl, который выдавал нужные статусы и заголовки, а также писал лог запросов и ответов.
В результате работы сервера получение данных клиентом будет происходить в 4 этапа:
- Клиент запрашивает документ, а сервер сообщает о необходимости Proxy-авторизации.
- Клиент снова запрашивает документ, но уже с данными авторизации на прокси.
- Для проверки работоспособности системы сервер просит авторизоваться ещё и для Web – модель ситуации, когда пользователь обращается к защищённому документу на удалённом сервере через прокси с авторизацией.
- Клиент послушно авторизуется «вдвойне» – на прокси-сервере и веб-сервере.
В качестве тестовых клиентов использовались браузеры Mozilla FireBird 0.6.1, Microsoft Internet Explorer 6.0.2800.1106 и Opera 6.05.
Код тестового сервера:
#!/usr/bin/perl -w
use strict;
use Socket;
# Создаётся сокет, привязывается ко всем адресам (для удобства) на порт 8080 и включается прослушивание.
socket(SERVER,PF_INET,SOCK_STREAM,getprotobyname("tcp"));
setsockopt(SERVER,SOL_SOCKET,SO_REUSEADDR,1);
bind(SERVER,sockaddr_in(8080,INADDR_ANY));
listen(SERVER,SOMAXCONN);
$|=1;
my $CR="?15?12";
# Приём входящих соединений
while (1){
# Приём клиента, определение его адрес/порт/хост и вывод на экран (для отладки)
my $paddr = accept(CLIENT,SERVER);
my ($ip,$port,$name) = remote($paddr);
print "Connection from $ip:$port ($name) ";
# Чтение всего запроса от клиента в одну переменную
my $DATA;
while(){
chomp;
$_=~s/ //g;
last unless $_;
$DATA.=$_." ";
}
# Запись запроса в лог-файл
Log($DATA);
# Теперь простая проверка на наличие в запросе нужных заголовков, отправка соответствующего ответа клиенту
# и запись ответов в лог-файл.
if($DATA !~/Proxy-Authorization/){
Log(Response407());
print CLIENT Response407();
}elsif($DATA !~/?12Authorization/){
Log(Response401());
print CLIENT Response401();
}else{
Log(Response200());
print CLIENT Response200();
}
print "Connection closed. ";
close CLIENT;
# Закрытие текущего соединения
}
# Закрытие сокета сервера
close SERVER;
# Составление ответов сервера для удобства вынесено в отдельные функции
sub Response401{
return "HTTP/1.1 401 Unauthorized$CR".
"Server: squid/2.5.STABLE3$CR".
"Mime-Version: 1.0$CR".
"Content-Type: text/html$CR".
"Content-Length: 20$CR".
"Expires: Wed, 26 Nov 2001 10:01:53 GMT$CR".
"WWW-Authenticate: Basic realm=" --== Protected web-Area ==--"$CR".
"Connection: close$CR$CR
}
sub Response407{
return "HTTP/1.1 407 Proxy Authentication Required$CR".
"Server: squid/2.5.STABLE3$CR".
"Mime-Version: 1.0$CR".
"Content-Type: text/html$CR".
"Content-Length: 20$CR".
"Expires: Wed, 26 Nov 2001 10:01:53 GMT$CR".
"Proxy-Authenticate: NTLM$CR".
"Proxy-Authenticate: Basic realm="<-- 407 Protected Proxy-->"$CR".
"Connection: close$CR$CR
}
sub Response200{
return "HTTP/1.1 200 OK$CR".
"Server: squid/2.5.STABLE3$CR".
"Mime-Version: 1.0$CR".
"Content-Type: text/html$CR".
"Content-Length: 19$CR".
"Expires: Wed, 26 Nov 2001 10:01:53 GMT$CR".
"Connection: close$CR$CR
}
# Функция определения адреса, порта и имени хоста клиента
sub remote{
my $rem = shift;
return undef unless $rem;
my ($port,$ip) = sockaddr_in($rem);
return (inet_ntoa($ip),$port,gethostbyaddr($ip,AF_INET));
}
# Функция для записи в файл протокола
sub Log{
open(F,">>connection.log");
print F scalar(localtime)." ";
for(split/ /,$_[0]){
print F " $_ ";
}
print F " //====// ";
close(F);
}
Первый запрос браузера:
GET /?test HTTP/1.1
Host: localhost
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.5a) Gecko/20030728 Mozilla Firebird/0.6.1
|
Сервер отвечает:
HTTP/1.1 407 Proxy Authentication Required
Server: squid/2.5.STABLE3
Mime-Version: 1.0
Content-Type: text/htmlContent-Length: 21
Proxy-Authenticate: NTLM
Proxy-Authenticate: Basic realm=" <-- 407 Protected Proxy-->"Connection: close
|
Теперь клиент авторизуется:
GET /?test HTTP/1.1
Host: localhost
Proxy-Authorization: NTLM JKHGJKHGLKJHAAAAt4IYUAAAAAAAAAAAAAAAAAAAAAA=
|
Для проверки последующей авторизации на удалённом веб-сервере прокси-сервер просит авторизоваться:
HTTP/1.1 401 Unauthorized
Server: squid/2.5.STABLE3
Mime-Version: 1.0
Content-Type: text/html
Content-Length: 20
WWW-Authenticate: Basic realm=" --== Protected web-Area ==--"
Connection: close
|
Клиент отвечает правильно – с авторизацией и на прокси- и на веб-сервере:
GET /?test HTTP/1.1
Host: localhost
Proxy-Authorization: NTLM JKHGJKHGLKJHAAAAt4IYUAAAAAAAAAAAAAAAAAAAAAA=
Authorization: Basic YmxhYmxhYmxhOg==
|
Сервер сообщает, что всё в порядке:
HTTP/1.1 200 OK
Server: squid/2.5.STABLE3
Mime-Version: 1.0
Content-Type: text/html
Content-Length: 19
Connection: close
|
Данный протокол на примере Mozilla FireBird 0.6.1 иллюстрирует вполне «законную» возможность использования авторизации на прозрачном прокси-сервере. Возникает резонный вопрос: почему в FAQ сервера Squid наличествует фраза «...proxy_auth can’t be used in a transparent proxy...»?
Для начала обратимся к исходным кодам Squid. Связь между авторизацией и режимом работы сервера прослеживается в двух файлах – acl.c и client_side.c. При анализе кода становится ясно, что возможность использования авторизации в данном случае просто игнорируется!
Участок исходного кода acl.c:
http_hdr_type headertype;
if (NULL == r) {
return -1;
} else if (!r->flags.accelerated) {
/* Proxy authorization on proxy requests */
headertype = HDR_PROXY_AUTHORIZATION;
} else if (r->flags.internal) {
/* WWW authorization on accelerated internal requests */
headertype = HDR_AUTHORIZATION;
} else {
#if AUTH_ON_ACCELERATION
/* WWW authorization on accelerated requests */
headertype = HDR_AUTHORIZATION;
#else
debug(28, 1) ("aclAuthenticated: authentication not applicable on accelerated requests. ");
return -1;
#endif
Участок исходного кода client_side.c:
if (answer == ACCESS_REQ_PROXY_AUTH || aclIsProxyAuth(AclMatchedName)) {
if (!http->flags.accel) {
/* Proxy authorisation needed */
status = HTTP_PROXY_AUTHENTICATION_REQUIRED;
} else {
/* WWW authorisation needed */
status = HTTP_UNAUTHORIZED;
}
if (page_id == ERR_NONE)
page_id = ERR_CACHE_ACCESS_DENIED;
} else {
status = HTTP_FORBIDDEN;
if (page_id == ERR_NONE)
page_id = ERR_ACCESS_DENIED;
}
Подобная странность, обнаруженная в ходе исследования, ещё больше разогрела интерес автора к обсуждаемому вопросу.
В связи с этим, естественно, исходный код сервера претерпел изменения. Результатом явилась модифицированная версия сервера Squid с совместной работой авторизации и прозрачного режима. Но...
В ходе дальнейшего исследования выяснилось, что популярнейший браузер Microsoft Internet Explorer не способен следовать стандартам! Если в настройках этого клиента явно не указано использование прокси-сервера, то MSIE просто игнорирует обработку http-статуса 407 и выдаёт ошибку. Мало того, старые версии под Windows 9X вообще «сыпятся» с критической ошибкой в библиотеке WININET.DLL при получении вышеописанного статус-кода.
В связи с этим становится ясно, что использование авторизации при прозрачном проксировании невозможно. Ведь подавляющее большинство пользователей работают именно с Microsoft Internet Explorer. Если в вашей сети используются браузеры только на основе Mozilla, вы можете модифицировать ваш сервер Squid-2.5.STABLE3 с помощью патчей, которые находятся по адресу http://www.comprice.ru/cmapuk/squid_patch.tgz
В дополнение к вышесказанному стоит добавить, что все нынешние браузеры, так или иначе, не полностью соблюдают стандарты. Например, HTTP-статус 305 (Use Proxy), сообщающий клиенту о необходимости использовать указанный в ответе прокси-сервер, игнорируется как браузером Microsoft Internet Explorer, так и Mozilla FireBird и Opera. Кроме того, браузер Opera (проверено на версии 6.05) не поддерживает NTLM-авторизацию, хотя статус-код 407 обрабатывает правильно и легко авторизуется по типу Basic.
Итак, в действительном существовании проблемы и практической невозможности её решения теперь сомнений нет. Однако остаётся неизвестной «политическая» подоплёка несоблюдения стандартов. После некоторых размышлений на эту тему автор статьи вывел гипотезу о причине «нестандартности» MSIE как HTTP-клиента.
Если абсолютно стандартный браузер при получении ответа сервера с кодом 407 отправляет данные для авторизации, то эта информация может быть получена любым третьим лицом. На примере это выглядит следующим образом. Пользователь-злоумышленник настраивает веб-сервер (внешний, либо в локальной сети) на ответ вышеозначенным кодом при любых запросах (это может быть элементарный «самописный» сервер в 10-15 строк). После этого путём простейших приёмов социальной инженерии пользователь-жертва заманивается в ловушку с целью получить всего лишь один HTTP-сеанс между жертвой и сервером злоумышленника. В результате «хакер» получает данные авторизации пользователя (например, данные NTLM-авторизации), что может повлечь за собой несанкционированный доступ к информации со всеми вытекающими последствиями.
Принимая во внимание эту гипотезу, можно сделать вывод, что игнорирование таких нужных и в то же время опасных стандартных возможностей имеет под собой довольно веские основания.
Множество протоколов
Как правило, в задачу прокси-сервера входит обслуживание клиентов не только по протоколу HTTP, но и FTP и HTTPS. Кроме того, часто возникает необходимость HTTP-соединения по альтернативным портам (8000, 8080, и т. п.). С этим связана вторая и, пожалуй, самая сложная проблема прозрачного проксирования – прокси-сервер Squid в режиме прозрачности может обслуживать соединения только по одному протоколу – HTTP.
В связи с тем, что решение данной проблемы является отнюдь не тривиальным, эта часть статьи будет посвящена рассмотрению причин данной проблемы и только теоретических способов её решения.
Альтернативные HTTP-порты
Как уже было сказано в начале статьи, спецификация протокола HTTP 1.1 предписывает клиенту включать в запрос обязательный заголовок «Host». Этот заголовок содержит имя сервера, которому адресован запрос. Таким образом, для получения данных по адресу http://www.server.info при прямом соединении минимальным HTTP-запросом будет следующий:
GET / HTTP/1.1
Host: www.server.info
Если клиентское ПО адаптировано для работы через прокси-сервер и настроено соответственно, то запрос будет выглядеть так:
GET http://www.server.info HTTP/1.1
Host: www.server.info
В случае если удалённый сервер обслуживает клиентов по альтернативному порту, запрос через прокси будет содержать информацию и об этом:
GET http://www.server.info:8080 HTTP/1.1
Host: www.server.info
При прямом соединении с удалённым сервером запрос клиента не меняется в зависимости от порта и остаётся таким же, как в первом примере. В результате при работе в прозрачном режиме прокси-сервер не может определить реальный порт удалённого сервера, к которому обратился клиент, так как клиент вообще не подозревает о существовании «посредника».
Современные версии прокси-сервера Squid поддерживают возможность определения хоста и порта с помощью библиотек пакетных фильтров, таких как ipfilter в BSD-системах или netfilter в Linux. Для работы с этими библиотеками при компиляции сервера необходимо указать соответствующие опции (--enable-ipf-transparent). После сборки сервера ему будет доступна подробная информация о соединении.
Участок кода client_side.c:
#if IPF_TRANSPARENT
natLookup.nl_inport = http->conn->me.sin_port;
natLookup.nl_outport = http->conn->peer.sin_port;
natLookup.nl_inip = http->conn->me.sin_addr;
natLookup.nl_outip = http->conn->peer.sin_addr;
Как может показаться, при таком подходе возникает необходимость использовать на firewall фильтрацию на основе ipfilter/ipnat и отказаться от ipfw. Однако для работы Squid достаточно просто включить поддержку данного пакетного фильтра, а перенаправлять пакеты можно по-прежнему с помощью ipfw.
Проксирование FTP и HTTPS
При обычном проксировании запросы клиента прокси-серверу на получение файла с удалённого сервера по протоколу FTP выглядят так же, как и HTTP-запросы:
GET ftp://ftp.server.info HTTP/1.1
Host: ftp.server.info
Клиентом, реализующим этот протокол FTP, в данном случае является сам прокси-сервер. Получив файл, прокси-сервер отвечает клиенту обычным HTTP-ответом и возвращает данные.
Также клиент может «потребовать» от прокси-сервера прямого соединения с удалённым хостом для обмена данными. Тогда запрос будет выглядеть так:
CONNECT ftp.server.info:21 HTTP/1.1
Host: ftp.server.info
Благодаря такому виду запросов посредник чётко понимает поставленную перед ним задачу и выполняет её в соответствии с рекомендациями системного администратора в виде директив acl и http_access в конфигурационном файле.
Общение клиента с удалённым сервером по SSL-защищённым протоколам всегда происходит по методу CONNECT:
CONNECT secure.server.info:443 HTTP/1.1
Host: secure.server.info
При прямом соединении клиента с удалённым хостом без посредников (а при прозрачном проксировании клиент «считает» именно так) он сам реализует протоколы прикладного уровня, такие как FTP и HTTP. В результате прокси-сервер не может определить поставленную перед ним задачу. При перенаправлении с помощью firewall всех соединений к портам 21 и 443 на порт прокси (3128) последний получает в первом случае строку «USER username», а во втором вообще набор несвязных символов.
Решение данной проблемы требует «хирургического» вмешательства в исходный код прокси-сервера Squid. Задача модификации сервера состоит в том, чтобы «научить» сервер становиться почти таким же посредником, как при методе CONNECT, в зависимости от номера порта запрашиваемого удалённого сервера.
Для демонстрации этой идеи напишем ещё один простейший сервер:
#!/usr/bin/perl -w
use strict;
use Socket;
# Локальный адрес мини-прокси
my $maddr = sockaddr_in(30021,inet_aton("localhost"));
# Допустим, мы уже знаем адрес удалённого FTP
my $paddr = sockaddr_in(21,inet_aton("ftp.freebsd.org"));
# Открываем сокет для прокси-сервера и начинаем прослушивать
socket(SOCK,PF_INET,SOCK_STREAM,getprotobyname("tcp")) or die $!;
setsockopt(SOCK,SOL_SOCKET,SO_REUSEADDR,1) or die $!;
bind(SOCK,$maddr) or die $!;
listen(SOCK,SOMAXCONN);
# Перехватываем сигнал PIPE. Этот сигнал появляется при попытке работы с закрытым потоком
$SIG{PIPE}=sub{
close(SERVER);
close(CLIENT);
close(SOCK);
exit;
}
$|=1; # отключаем буферизацию потока STDOUT
# Принимаем подключения
while (accept(CLIENT,SOCK)){
print "Connection detect. ";
# Соединяемся с удалённым FTP
socket(SERVER,PF_INET,SOCK_STREAM,getprotobyname("tcp")) or die $!;
connect(SERVER,$paddr);
# Начинаем обмен информацией
while(1){
my $server="";
# Отключаем буферизацию потоков клиента и сервера
select(CLIENT); $|=1;
select(SERVER); $|=1;
select(STDOUT);
# Пока сервер не завершил передачу
# идентификатором статуса принимаем все данные, отдаём клиенту, а заодно выводим на экран
while($server !~/^d{3}s/){
$server=;
print CLIENT $server;
print $server;
}
# Принимаем команду от клиента и передаём серверу. Также выводим на экран
my $client=;
print SERVER $client;
print $client;
}
close SERVER;
close CLIENT;
}
close SOCK;
Добавляем в firewall правило перенаправления всех запросов к 21-му порту на локальный порт 30021 и запускаем тестовый сервер.
ipfw add 30002 fwd 127.0.0.1,30021 tcp from 192.168.0.0/24 to any 21 via xl0
Теперь открываем браузер и пробуем зайти на ftp://ftp.freebsd.org (естественно, без прокси-настроек). Результат простейшего теста показывает, что прозрачное проксирование по протоколам, отличным от HTTP, вполне возможно. Теперь поставим уже конкретную задачу по модификации прокси-сервера Squid.
1. Добавить в возможности конфигурирования сервера новую директиву (назовём её direct_port) следующего формата:
direct_port PORT PROTOCOL
где PORT – конечный порт удалённого сервера; PROTOCOL – протокол, по которому прокси-серверу следует выступать посредником. Пример:
direct_port 21 FTP, direct_port 443 SSL
2. Добавить к уже имеющейся «услуге» посредничества при методе CONNECT её модифицированную версию, в которой исключены вмешательства прокси-сервера в общение клиента и удалённого сервера лишними заголовками.
3. Установить контроль над новым типом соединения с помощью директив ACL.
Решение этой задачи для исследователя, никогда не участвовавшего в разработке прокси-сервера Squid, является весьма трудоёмким процессом. Посему у автора данной статьи на данный момент нет готового решения в виде патчей и т. п. Однако, возможно, это исследование привлечёт внимание энтузиастов (или самих разработчиков Squid) к вышеописанной проблеме и решение появится.
Вывод
Исследование показало, что настоящее прозрачное проксирование без ущерба для пользователей и администраторов – это реальность. Единственной серьёзной проблемой на пути к внедрению технологии прозрачного проксирования остаётся несоответствие стандартам браузера Microsoft Internet Explorer. Вполне возможно, что в будущем этот недостаток у MSIE исчезнет, если обратить внимание специалистов из Microsoft на данную проблему. В настоящий момент, а точнее, после того, как прокси-сервер Squid будет модифицирован, любая организация, в чьи корпоративные стандарты не входит использование браузера MSIE, смогут полноценно пользоваться прозрачным проксированием.
Ещё одна проблема, оставшаяся в тени, заключается в том, что прокси-сервер может определить адрес удалённого сервера, но не его имя. В связи с этим может возникнуть проблема с доступом по FTP и HTTPS на сервера с виртуальными доменами, которые часто используются на бесплатных хостингах (и не только).
В заключение хотелось бы сказать хоть одну фразу от первого лица. Я надеюсь, что проделанная работа не оставит равнодушной общественность свободных разработчиков к несовершенствам прикладного программного обеспечения и подтолкнёт любителей и профессионалов к новым исследованиям.