Рубрика:
Карьера/Образование /
Вектор роста
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
ИЛЬЯ РУДЬ, ведущий сертифицированный тренер Microsoft по направлениям SharePoint и Exchange, MVP в Центре компьютерного обучения «Специалист» при МГТУ им. Н.Э.Баумана, основатель ресурса itband.ru
SharePoint 2010 в России
Что вы думаете о его перспективах? Стоит ли изучать SharePoint? Если да, то как изучить и стать специалистом по нему?
Эти вопросы я слышу настолько часто, что решил написать статью. У Microsoft есть продукты, которые уже достаточно давно являются общепризнанными флагманами, тот же Exchange – стандарт де-факто в компаниях с Microsoft-ориентированной инфраструктурой. С SharePoint 2010 все сложнее.
Выступая в ноябре на международной конференции «TechEd Россия 2011», главный операционный директор Microsoft Кевин Тернер несколько раз подчеркнул, что SharePoint – самый динамично растущий продукт с точки зрения объемов продаж в истории компании. Казалось бы, перспективы у продукта радужные, и ИТ-специалист просто обязан уметь с ним работать. Но почему же тогда возникают вопросы? Ответ прост, в России SharePoint применяется далеко не повсеместно, процент неудачных внедрений высок, а попытка разобраться с продуктом приводит к мысли о его чрезмерной сложности. Давайте разберемся, так ли это.
Нужен ли SharePoint среднестатистическому сотруднику?
В большинстве ситуаций на выходе неудачного внедрения мы получаем решение, которое либо не работает, либо работает медленно, либо не нужно заказчику, либо заказчик банально не знает, как его использовать. В случае SharePoint проблема заключается в том, что на конечного пользователя вываливается гора сервисов, при этом анализом того, какие сервисы нужны сотрудникам конкретной организации, никто не занимается, а обучение пользователей просто не предусмотрено.
SharePoint реально позволяет упростить жизнь персоналу при работе с информацией, но для этого и ИТ-специалисты, и сотрудники должны быть открыты для новых способов работы. А пока компании решают, открыты они или нет для новых решений, отдельные «ООО» наращивают объемы и в кризисные годы.
Ответ таков: SharePoint нужен, но подавать его необходимо грамотно, при этом сам подающий должен знать, как использовать этот инструмент. Ориентироваться на слабых – неправильный путь, сильные компании с грамотным менеджментом и персоналом уже не первый год используют SharePoint в работе. Рано или поздно те, кто привык забивать гвозди микроскопом, уйдут с рынка. Если вы хотите быть в их числе, ИТ и SharePoint, в частности, вам не нужны.
А может, лучше сменить профиль?
Некоторые особо впечатлительные специалисты от частого упоминания слова «облако» начали впадать в панику. Для них облако стало синонимом безработицы и полной ненужности всего, с чем они до этого работали. Кто-то довольно точно сравнил облачные технологии с подростковым сексом: «Мало кто пробовал, кто пробовал, тому не понравилось, но все о нем говорят». Да, согласен, что в перспективе часть сервисов перейдет из серверных в дата-центры, но только часть и не сразу. Давайте без паники. Если бы все предсказания сбывались, то ИТ-отделов уже лет пять бы не существовало, их заменили бы услуги аутсорсеров.
Даже если предположить, что все уйдет в облака, SharePoint – это тот продукт, который займет там самое важное место. И не все ли равно, поддерживать сервер, гудящий в вашей серверной или в серверной, находящейся в Европе.
Ответ: тем, кто любит ИТ, бояться нечего. Облака дадут много интересной работы профессионалам. И специалисты в SharePoint будут с вкусным куском пирога.
Как изучить SharePoint, и почему он такой сложный?
Полностью согласен с теми, кто считает SharePoint сложным продуктом. С одной стороны, не имея опыта администрирования Windows Server, понимания работы служб Active Directory DS, DNS, к нему вообще подходить не стоит. С другой стороны, необходимо хотя бы минимально разбираться в IIS и БД SQL. Поскольку решение находится на стыке технологий, придется и об интеграции с Exchange подумать. А при наличии требований пользователей по кастомизации потребуется опыт дизайнера и разработчика. Многие, услышав это, просто сразу сдаются, хотя все не так страшно. Поймите, что в SharePoint есть четкое разделение труда. Времена «джедаев» прошли. Писать код, заниматься одновременно дизайном и администрированием хорошо невозможно.
Если вы ИТпро, на ваши плечи ложатся планирование инфраструктуры фермы SharePoint, внедрение решения, полная настройка и последующее обслуживание. При этом вы должны уметь работать с SharePoint как продвинутый конечный пользователь, а лучше даже как администратор сайта. Как этого достичь? Могу предложить один из вариантов.
В качестве константы я подразумеваю, что вы уже являетесь системным администратором с опытом работы с серверными операционными системами и основными инфраструктурными службами. Первый кирпич в успешной поддержке SharePoint – это знания по SQL как минимум в объеме программ курсов М2778 Создание запросов в Microsoft SQL Server 2008 и М6231 Поддержка баз данных в Microsoft SQL Server 2008 R2.
Это тот бэкграунд, без которого в SharePoint очень тяжело. Контент порталов хранится в базах SQL, конфигурация SharePoint – также в базах SQL. Не имея базовых навыков обслуживания, резервного копирования и восстановления, работать с SharePoint невозможно. Когда фундамент заложен, можно переходить непосредственно к SharePoint, сразу изучать административную часть сложно, поскольку у администратора отсутствует опыт обычного пользователя в данном направлении.
Поэтому для тех, кто берется за дело серьезно, я советую после SQL слушать пользовательские курсы по эффективной работе с Microsoft SharePoint 2010. После прослушивания курса специалист начинает понимать, что нужно дать конечному пользователю.
Теперь самое важное – продукт для ИТпро представлен двумя курсами М10174 Настройка и управление Microsoft SharePoint 2010 и М10231 Проектирование и развертывание Microsoft SharePoint 2010. Курсы технические и достаточно плотные с точки зрения программы. Фактически получается пять недель непрерывной учебы, хотя я бы советовал делать между курсами промежутки, давая голове отдохнуть, а рукам – время на практику. Курсы были и остаются самым быстрым способом получения знаний.
Для тех, у кого нет возможности учиться на авторизованных курсах, есть иной путь – самостоятельная подготовка. В любом случае вам понадобится достаточно мощное «железо» с 16-24 Гб оперативной памяти и двумя, а лучше тремя жесткими дисками. Связаны такие серьезные требования с тем, что в процессе обучения и стендового тестирования вам придется одновременно запускать до четырех серверов, а это требует ресурсов. Можно воспользоваться комплектом из трех виртуальных машин, поставляемых Microsoft, на которых уже предустановлены и перенастроены SharePoint Server 2010, Exchange Server 2010 и Lync Server 2010. Когда стенд подготовлен, вашими инструментами будут книги, записи всевозможных докладов и усидчивость, без которой в данном деле не обойтись.
Много ли денег нужно на внедрение SharePoint, и с чего начать?
На самом деле все не так страшно, особенно если учесть, что SharePoint представлен вполне функциональными бесплатными версиями, такими как SharePoint Foundation и SharePoint Server Express, на которых при желании можно реализовать приличный портальный функционал без лицензионных платежей.
Когда мне задают вопрос, с чего начать, я обычно предлагаю посмотреть на корпоративный поиск. SharePoint 2010 Search Server Express, задачей которого и является предоставление и обслуживание сервиса поиска в вашей организации, может быть прекрасно установлен на существующий файловый сервер. Поскольку продукт из семейства SharePoint, неудивительно, что ему необходим SQL. В качестве сервера баз данных можно задействовать SQL Server 2008 R2 Express with Advanced Services. Естественно, нужно понимать, что использование версии SQL Express накладывает ряд ограничений, вроде поддержки только одного процессора, 1 Гб памяти и размера базы в 10 Гб, но мы и не планируем на бесплатных версиях индексировать десятки миллионов документов. Это бюджетный вариант для небольшой организации, которая созрела для создания собственной системы поиска.
Чтобы не городить на табуретке Эйфелеву башню, определитесь с системными требованиями, а это 64-разрядный процессор в четыре ядра, 8 Гб оперативной памяти, и чем быстрее дисковая система, тем лучше. На крайний случай подойдут два диска – один под систему, другой под БД.
Думаю, что многие задаются вопросом: «На какое количество документов такое решение рассчитано? Явно же MS бесплатно ничего серьезного не даст?» Чтобы ответить на него, нужно понимать, как работает поиск.
Рисунок 1. Архитектура решения
Первый компонент архитектуры – это Index Server, или Индексирующий сервер, содержащий один или несколько Crawler (Обходчиков).
При запуске Crawler (Обходчик) берет адрес источника контента (Content Source) и устанавливает соединение.
Обходчик должен понимать форматирование и в некоторых случаях бинарный формат хранения файла. Это понимание приходит к нему с установкой Filter Pack 2.0 (x64). Если помните, Filter Pack является обязательным предварительным компонентом для инсталляции SharePoint. В стандартный набор понимаемых форматов входят документы Microsoft Office 2003, 2007, 2010; HTML; text файлы; XML; TIFF. Для индексирования других форматов придется устанавливать дополнительные iFilter.
Crawler разбивает текст на слова, выкидывает знаки пунктуации и пробелы так, чтобы SharePoint мог определить окончание одного слова и начало другого. Финально Crawler выкидывает такие слова, как «at», «the», «is».
Далее Index Server передает текстовую информацию (Операция Index propagation) в соответствующий раздел индекса на Query server. Парадокс заключается в том, что сервер, индексирующий контент, не хранит индекс у себя.
Query server содержит раздел с индексом и отвечает на поисковые запросы пользователей. Пользователь открывает сайт SharePoint, вводит запрос в строке поиска, после чего Web Front End сервер перенаправляет этот запрос на Query server. Этот сервер извлекает информацию из индекса, который хранится локально на одном из его дисков, и возвращает ответ.
Но это еще не все, искать мы можем как по содержимому файла, так и по его метаданным. Каждый документ окружает облако дополнительной информации: кто создал, когда создал, формат документа, язык, срок действия. Это как раз и называется метаданными или данными о данных. Информация также индексируется, но сохраняется не в разделе индекса на Query server, а в отдельной базе данных Search Property Database. Следовательно, при получении поискового запроса Query server обращается за информацией как в индекс, так и в базу данных свойств. Это не единственная база, которая создается на этапе работы мастера по конфигурированию фермы.
Также мы имеем:
- Search Crawl Database – содержит информацию о статусе обходов, индексированных файлах и истории обходов. Информацию том, что и когда мы индексировали, а также чем это закончилось.
- Search Administration Database – наполнена данными о конфигурации службы поиска, ее топологии, источниках обхода и всех дополнительных настройках, которые могут быть включены. Фактически она хранит конфиг сервисного приложения Search.
А теперь давайте попробуем вернуться к вопросу масштабируемости. Для начала отметим, что SharePoint 2010 Search Server Express подается как решение поиска с одним сервером! Следовательно, все компоненты с рис. 1 будут совмещены на одном-единственном сервере с одним-единственным разделом индекса.
Посчитать его приблизительный размер легко:
TotalIndexSize = CorpusSize * 0.035
Следовательно, проиндексируя 1 Тб документов, мы получим индекс порядка 36 Гб. Вроде немного, но у нас есть четкое ограничение по размеру SQL баз данных, мы же помним о потолке в 10 Гб.
Но размер баз данных тоже считается несложно:
TotalPropertyDBSize = CorpusSize * 0.015
TotalPropertyLogSize = CorpusSize * 0.0031
Выполняя простые вычисления, мы определяем, что после индексирования 1 Тб документов файл базы свойств будет равен 15 Гб, а транзакционный лог – порядка 3 Гб. Так в расчетах мы вышли за допустимые пределы.
Давайте перевернем формулу и попробуем посчитать, какой объем (CorpusSize) нам под силу заиндексировать.
Я оттолкнулся от размера базы в 9,5 Гб.
CorpusSize = TotalPropertyDBSize / 0.015
CorpusSize = 9500 Мб / 0.015 = 630 000 Мб = 630 Гб
Ответ: с SQL Express мы можем заиндексировать 630 Гб документов.
Что говорит MS по этому поводу? Что бесплатной версии должно хватить на 300,000 документов. Проверим это утверждение. В моей личной подборке статей и презентаций средний размер офисного документа равен 1 Мб. Следовательно, в 630 Гб войдет порядка 600 тысяч документов.
Вывод: тут компания Microsoft даже поскромничала, указав 300,000 документов, хотя вы всегда сами можете взять средний размер своего документа и прикинуть собственные границы.
Праздновать победу рано, мы забыли еще про две базы данных: Search Crawl Database и Search Administration Database. Сразу откинем Search Administration Database, ее размер гарантировано будет меньше 10 Гб, просто в ней нет столько данных для достижения такого размера.
А вот базу Search Crawl Database легко посчитать:
TotalCrawlDBSize = CorpusSize * 0.046
TotalCrawlLogSize = CorpusSize * 0.011
Смотрим, что получается при тех же вводных данных размером 630 Гб.
TotalCrawlDBSize = 630 000 Мб * 0.046 = 28 Гб.
TotalCrawlLogSize = 630 000 Мб * 0.011 = 7 Гб.
Вывод: выходит, что расчет на 600 тысяч документов оказался неправильным, и его нужно поделить на три? И на выходе мы получим 200 тысяч документов, что даже меньше обещаний вендора?
Я неоднократно проводил расчеты, сравнивал их с реальными показателями и могу поручиться, что расчетные данные являются потолочными и содержат очень и очень хороший запас прочности.
Имейте в виду, что, заменив в данной архитектуре SQL Express на полноценную версию, вы сразу поднимете количество индексируемых документов до границы в 8-10 миллионов штук. А используя данную статью, несложно прикинуть, на что можно рассчитывать в вашем конкретном случае.
Для чего я написал эту статью
Мне очень хочется показать, что SharePoint – действительно интересное направление, которое можно и нужно развивать. Бесплатные версии зачастую позволяют реализовать как совместную работу, так и сервисы для небольших организаций (например, поиск). А самое главное, такие бесплатные версии позволяют специалистам получить необходимый опыт работы с новой платформой и подготовить сотрудников к новым возможностям, не бросая их в океан новых сервисов с перегрузкой информацией, приводящей к ее отторжению. Впоследствии, когда компания будет готова оценить всю мощь платных версий, переход с SharePoint Foundation или SharePoint Server Express не станет чем-то особенным.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|