В преддверии Международного женского дня проект ВКонтакте открыл исходные коды своих внутренних разработок. Очевидно, таким образом решили преподнести праздничный подарок всем женщинам-программисткам. Исторически сложилось, что все продукты имеют префикс kitten, так что речь пойдет о разных котятах
Центральное и наиболее обсуждаемое решение – это PHP-котята (kitten-PHP), или сокращенно kPHP. Так разберемся, что же это за зверь – PHP-котята? Это транслятор кода с языка PHP в язык С++. По сообщению представителей VK, данной разработкой они занимаются с 2010 года.
ВКонтакте – это проект с почти 10-летней историей, и его разработка велась тогда еще на РНР3. Как правило, уже действующие и приносящие прибыль проекты не переписываются, а только дополняются новыми функциональными возможностями. А при дополнении наиболее целесообразно писать код в общепринятом стиле и использовать существующее API. Из этого можно сделать вывод, что над миграцией кода на более новые версии долгое время особо незадумывались.
Проект рос, и в какой-то момент перевалил за 50 млн суточной посещаемости пользователей. По некоторой информации, сейчас новый дата-центр VK рассчитан на 25 тыс. серверов. Если как-то и можно сократить число серверов хотя бы на 10%, то при таких количествах это уже экономически выгодно. Очевидно, после неудачных попыток использования HHVM (о HHVM будет рассказано ниже), что представители VK не отрицают, было принято решение изобрести собственный велосипед.
Представителями VK было заявлено, что после перехода на kPHP они стали использовать почти в два раза меньше серверов для обработки пользовательских запросов при прежней нагрузке.
Рисунок 1. Среднее время загрузки страниц
Коротко о технологии. Исходный код ВКонтакте с помощью транслятора kPHP транслируется в C++. После этого сгенерированный C++ код автоматически компилируется средствами gcc, в результате чего получается исполняемый файл, готовый для запуска.
В зависимости от опций компиляции исполняемый файл может быть представлен как специализируемый веб-сервер, принимающий http-запросы и генерирующий страницы.