Рубрика:
Карьера/Образование /
Пятая пара
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
ВАЛЕНТИН СИНИЦЫН, эксперт в области системных и сетевых технологий Linux, преподаватель. Доцент Уральского федерального университета, valentine.sinitsyn@gmail.com
lguest: виртуализация изнутри
Разберемся, как работает один из самых простых гипервизоров, когда-либо выходивших для платформы x86
Согласно утверждению Артура Кларка «любая достаточно развитая технология неотличима от магии», и, по довольно распространенному мнению, мониторы виртуальных машин (ВМ) или гипервизоры попадают как раз в эту категорию. Конечно, есть и специализированная литература [1], и курсы на профильных факультетах, но это все не то, что студент или просто интересующийся мог бы освоить за дождливые выходные.
Такое положение вещей едва ли идет на пользу индустрии, и, возможно, поэтому Пол «Ржавый» Рассел (Rusty Russel), тот самый, которому мы обязаны Netfilter, создал lguest [2] – паравиртуализатор архитектуры x86 для Linux, умещающийся в 5000 строк (на C и ассемблере), игрушечный, но полностью работоспособный и предназначенный специально для изучения. Он не блещет производительностью или возможностями, но использует ту же инфраструктуру, что и промышленные решения, например, Xen или KVM. lguest входит в официальные релизы ядра Linux начиная с 2.6.23, а не так давно его код был реорганизован и подготовлен к портированию на архитектуры, отличные от x86. Все это делает проект очень интересным для тех, кто хочет разобраться, как же на самом деле работает гипервизор.
В этой статье мы пошагово, с привязкой к исходному коду, рассмотрим основные операции, выполняемые lguest. Мы предполагаем, что вы успели ознакомиться со статьей «Виртуализация на платформе x86», опубликованной в предыдущем выпуске «Пятой пары» [6], и термины вроде «Trap and Emulate» или «паравиртуализированные драйверы» не вызывают вопросов.
Путеводитель по ядру
Изучение исходных текстов большого проекта, такого как Linux, невозможно без надежного средства навигации. Стандартным инструментом для этого является Cscope: перейдите в каталог с исходными текстами ядра и скомандуйте «make cscope; cscope», чтобы получить возможность искать определения функций, места, откуда они вызываются, быстро переходить к нужному файлу и т.п. Аналогичный сервис можно найти онлайн на lxr.linux.no или lxr.free-electrons.com. Имейте в виду, что эти инструменты ориентированы на C, поэтому могут спасовать, когда речь идет об ассемблере и скриптах компоновщика.
Нехорошие инструкции
Давайте посмотрим, что происходит в ядре при выполнении одной из «плохих» инструкций, нарушающих принцип Trap and Emulate – к примеру, пары pushf/popf. Для паравиртуализации ядра Linux lguest использует инфраструктуру paravirt_ops, применяемую также и Xen. Она представляет собой набор структур, хранящих указатели на функции. Когда ядро делает что-то потенциально интересное для гипервизора, вызывается одна из таких функций (в дальнейшем мы будем называть их виртуальными методами), которая в зависимости от окружения превращается или в обращение к монитору ВМ, или в родную ассемблерную инструкцию.
Для сохранения флагов ядро Linux вызывает функцию local_save_flags(), сводящуюся в конечном итоге к arch_local_save_flags(). Последняя определена в arch/x86/include/asm/irqflags.h следующим образом (здесь и далее используются фрагменты кода ядра Linux 3.11; комментарии удалены для экономии места):
#ifdef CONFIG_PARAVIRT
#include <asm/paravirt.h>
#else
…
static inline notrace unsigned long arch_local_save_flags(void)
{
return native_save_fl();
}
Если ядро было скомпилировано без поддержки паравиртуализации (CONFIG_PARAVIRT не определен), вызывается native_save_fl(), эквивалентная двум ассемблерным инструкциям:
pushf;
pop flags
где flags – возвращаемая функцией локальная переменная. В противном случае arch_local_save_flags() превращается в:
static inline notrace unsigned long arch_local_save_flags(void)
{
return PVOP_CALLEE0(unsigned long, pv_irq_ops.save_fl);
}
Статью целиком читайте в журнале «Системный администратор», №11 за 2013 г. на страницах 84-90.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|