SharePoint 2010 в России::Журнал СА 12.2011
www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
О журнале
Журнал «БИТ»
Наука и технологии
Подписка
Где купить
Авторам
Рекламодателям
Магазин
Архив номеров
Вакансии
Контакты
   

  Опросы

Какие курсы вы бы выбрали для себя?  

Очные
Онлайновые
Платные
Бесплатные
Я и так все знаю

 Читать далее...

1001 и 1 книга  
20.12.2019г.
Просмотров: 1235
Комментарии: 0
Dr.Web: всё под контролем

 Читать далее...

04.12.2019г.
Просмотров: 1257
Комментарии: 0
Особенности сертификаций по этичному хакингу

 Читать далее...

28.05.2019г.
Просмотров: 3786
Комментарии: 2
Анализ вредоносных программ

 Читать далее...

28.05.2019г.
Просмотров: 4009
Комментарии: 1
Микросервисы и контейнеры Docker

 Читать далее...

28.05.2019г.
Просмотров: 3203
Комментарии: 0
Django 2 в примерах

 Читать далее...

Друзья сайта  

Форум системных администраторов  

sysadmins.ru

 SharePoint 2010 в России

Архив номеров / 2011 / Выпуск №12 (109) / SharePoint 2010 в России

Рубрика: Карьера/Образование /  Вектор роста

Илья Рудь ИЛЬЯ РУДЬ, ведущий сертифицированный тренер Microsoft по направлениям SharePoint и Exchange, MVP в Центре компьютерного обучения «Специалист» при МГТУ им. Н.Э.Баумана, основатель ресурса itband.ru

SharePoint 2010 в России

Что вы думаете о его перспективах? Стоит ли изучать SharePoint? Если да, то как изучить и стать специалистом по нему?

Эти вопросы я слышу настолько часто, что решил написать статью. У Microsoft есть продукты, которые уже достаточно давно являются общепризнанными флагманами, тот же Exchange – стандарт де-факто в компаниях с Microsoft-ориентированной инфраструктурой. С SharePoint 2010 все сложнее.

Выступая в ноябре на международной конференции «TechEd Россия 2011», главный операционный директор Microsoft Кевин Тернер несколько раз подчеркнул, что SharePoint – самый динамично растущий продукт с точки зрения объемов продаж в истории компании. Казалось бы, перспективы у продукта радужные, и ИТ-специалист просто обязан уметь с ним работать. Но почему же тогда возникают вопросы? Ответ прост, в России SharePoint применяется далеко не повсеместно, процент неудачных внедрений высок, а попытка разобраться с продуктом приводит к мысли о его чрезмерной сложности. Давайте разберемся, так ли это.

Нужен ли SharePoint среднестатистическому сотруднику?

В большинстве ситуаций на выходе неудачного внедрения мы получаем решение, которое либо не работает, либо работает медленно, либо не нужно заказчику, либо заказчик банально не знает, как его использовать. В случае SharePoint проблема заключается в том, что на конечного пользователя вываливается гора сервисов, при этом анализом того, какие сервисы нужны сотрудникам конкретной организации, никто не занимается, а обучение пользователей просто не предусмотрено.

SharePoint реально позволяет упростить жизнь персоналу при работе с информацией, но для этого и ИТ-специалисты, и сотрудники должны быть открыты для новых способов работы. А пока компании решают, открыты они или нет для новых решений, отдельные «ООО» наращивают объемы и в кризисные годы.

Ответ таков: SharePoint нужен, но подавать его необходимо грамотно, при этом сам подающий должен знать, как использовать этот инструмент. Ориентироваться на слабых – неправильный путь, сильные компании с грамотным менеджментом и персоналом уже не первый год используют SharePoint в работе. Рано или поздно те, кто привык забивать гвозди микроскопом, уйдут с рынка. Если вы хотите быть в их числе, ИТ и SharePoint, в частности, вам не нужны.

А может, лучше сменить профиль?

Некоторые особо впечатлительные специалисты от частого упоминания слова «облако» начали впадать в панику. Для них облако стало синонимом безработицы и полной ненужности всего, с чем они до этого работали. Кто-то довольно точно сравнил облачные технологии с подростковым сексом: «Мало кто пробовал, кто пробовал, тому не понравилось, но все о нем говорят». Да, согласен, что в перспективе часть сервисов перейдет из серверных в дата-центры, но только часть и не сразу. Давайте без паники. Если бы все предсказания сбывались, то ИТ-отделов уже лет пять бы не существовало, их заменили бы услуги аутсорсеров.

Даже если предположить, что все уйдет в облака, SharePoint – это тот продукт, который займет там самое важное место. И не все ли равно, поддерживать сервер, гудящий в вашей серверной или в серверной, находящейся в Европе.

Ответ: тем, кто любит ИТ, бояться нечего. Облака дадут много интересной работы профессионалам. И специалисты в SharePoint будут с вкусным куском пирога.

Как изучить SharePoint, и почему он такой сложный?

Полностью согласен с теми, кто считает SharePoint сложным продуктом. С одной стороны, не имея опыта администрирования Windows Server, понимания работы служб Active Directory DS, DNS, к нему вообще подходить не стоит. С другой стороны, необходимо хотя бы минимально разбираться в IIS и БД SQL. Поскольку решение находится на стыке технологий, придется и об интеграции с Exchange подумать. А при наличии требований пользователей по кастомизации потребуется опыт дизайнера и разработчика. Многие, услышав это, просто сразу сдаются, хотя все не так страшно. Поймите, что в SharePoint есть четкое разделение труда. Времена «джедаев» прошли. Писать код, заниматься одновременно дизайном и администрированием хорошо невозможно.

Если вы ИТпро, на ваши плечи ложатся планирование инфраструктуры фермы SharePoint, внедрение решения, полная настройка и последующее обслуживание. При этом вы должны уметь работать с SharePoint как продвинутый конечный пользователь, а лучше даже как администратор сайта. Как этого достичь? Могу предложить один из вариантов.

В качестве константы я подразумеваю, что вы уже являетесь системным администратором с опытом работы с серверными операционными системами и основными инфраструктурными службами. Первый кирпич в успешной поддержке SharePoint – это знания по SQL как минимум в объеме программ курсов М2778 Создание запросов в Microsoft SQL Server 2008 и М6231 Поддержка баз данных в Microsoft SQL Server 2008 R2.

Это тот бэкграунд, без которого в SharePoint очень тяжело. Контент порталов хранится в базах SQL, конфигурация SharePoint – также в базах SQL. Не имея базовых навыков обслуживания, резервного копирования и восстановления, работать с SharePoint невозможно. Когда фундамент заложен, можно переходить непосредственно к SharePoint, сразу изучать административную часть сложно, поскольку у администратора отсутствует опыт обычного пользователя в данном направлении.

Поэтому для тех, кто берется за дело серьезно, я советую после SQL слушать пользовательские курсы по эффективной работе с Microsoft SharePoint 2010. После прослушивания курса специалист начинает понимать, что нужно дать конечному пользователю.

Теперь самое важное – продукт для ИТпро представлен двумя курсами М10174 Настройка и управление Microsoft SharePoint 2010 и М10231 Проектирование и развертывание Microsoft SharePoint 2010. Курсы технические и достаточно плотные с точки зрения программы. Фактически получается пять недель непрерывной учебы, хотя я бы советовал делать между курсами промежутки, давая голове отдохнуть, а рукам – время на практику. Курсы были и остаются самым быстрым способом получения знаний.

Для тех, у кого нет возможности учиться на авторизованных курсах, есть иной путь – самостоятельная подготовка. В любом случае вам понадобится достаточно мощное «железо» с 16-24 Гб оперативной памяти и двумя, а лучше тремя жесткими дисками. Связаны такие серьезные требования с тем, что в процессе обучения и стендового тестирования вам придется одновременно запускать до четырех серверов, а это требует ресурсов. Можно воспользоваться комплектом из трех виртуальных машин, поставляемых Microsoft, на которых уже предустановлены и перенастроены SharePoint Server 2010, Exchange Server 2010 и Lync Server 2010. Когда стенд подготовлен, вашими инструментами будут книги, записи всевозможных докладов и усидчивость, без которой в данном деле не обойтись.

Много ли денег нужно на внедрение SharePoint, и с чего начать?

На самом деле все не так страшно, особенно если учесть, что SharePoint представлен вполне функциональными бесплатными версиями, такими как SharePoint Foundation и SharePoint Server Express, на которых при желании можно реализовать приличный портальный функционал без лицензионных платежей.

Когда мне задают вопрос, с чего начать, я обычно предлагаю посмотреть на корпоративный поиск. SharePoint 2010 Search Server Express, задачей которого и является предоставление и обслуживание сервиса поиска в вашей организации, может быть прекрасно установлен на существующий файловый сервер. Поскольку продукт из семейства SharePoint, неудивительно, что ему необходим SQL. В качестве сервера баз данных можно задействовать SQL Server 2008 R2 Express with Advanced Services. Естественно, нужно понимать, что использование версии SQL Express накладывает ряд ограничений, вроде поддержки только одного процессора, 1 Гб памяти и размера базы в 10 Гб, но мы и не планируем на бесплатных версиях индексировать десятки миллионов документов. Это бюджетный вариант для небольшой организации, которая созрела для создания собственной системы поиска.

Чтобы не городить на табуретке Эйфелеву башню, определитесь с системными требованиями, а это 64-разрядный процессор в четыре ядра, 8 Гб оперативной памяти, и чем быстрее дисковая система, тем лучше. На крайний случай подойдут два диска – один под систему, другой под БД.

Думаю, что многие задаются вопросом: «На какое количество документов такое решение рассчитано? Явно же MS бесплатно ничего серьезного не даст?» Чтобы ответить на него, нужно понимать, как работает поиск.

Рисунок 1. Архитектура решения

Рисунок 1. Архитектура решения

Первый компонент архитектуры – это Index Server, или Индексирующий сервер, содержащий один или несколько Crawler (Обходчиков).

При запуске Crawler (Обходчик) берет адрес источника контента (Content Source) и устанавливает соединение.

Обходчик должен понимать форматирование и в некоторых случаях бинарный формат хранения файла. Это понимание приходит к нему с установкой Filter Pack 2.0 (x64). Если помните, Filter Pack является обязательным предварительным компонентом для инсталляции SharePoint. В стандартный набор понимаемых форматов входят документы Microsoft Office 2003, 2007, 2010; HTML; text файлы; XML; TIFF. Для индексирования других форматов придется устанавливать дополнительные iFilter.

Crawler разбивает текст на слова, выкидывает знаки пунктуации и пробелы так, чтобы SharePoint мог определить окончание одного слова и начало другого. Финально Crawler выкидывает такие слова, как «at», «the», «is».

Далее Index Server передает текстовую информацию (Операция Index propagation) в соответствующий раздел индекса на Query server. Парадокс заключается в том, что сервер, индексирующий контент, не хранит индекс у себя.

Query server содержит раздел с индексом и отвечает на поисковые запросы пользователей. Пользователь открывает сайт SharePoint, вводит запрос в строке поиска, после чего Web Front End сервер перенаправляет этот запрос на Query server. Этот сервер извлекает информацию из индекса, который хранится локально на одном из его дисков, и возвращает ответ.

Но это еще не все, искать мы можем как по содержимому файла, так и по его метаданным. Каждый документ окружает облако дополнительной информации: кто создал, когда создал, формат документа, язык, срок действия. Это как раз и называется метаданными или данными о данных. Информация также индексируется, но сохраняется не в разделе индекса на Query server, а в отдельной базе данных Search Property Database. Следовательно, при получении поискового запроса Query server обращается за информацией как в индекс, так и в базу данных свойств. Это не единственная база, которая создается на этапе работы мастера по конфигурированию фермы.

Также мы имеем:

  • Search Crawl Database – содержит информацию о статусе обходов, индексированных файлах и истории обходов. Информацию том, что и когда мы индексировали, а также чем это закончилось.
  • Search Administration Database – наполнена данными о конфигурации службы поиска, ее топологии, источниках обхода и всех дополнительных настройках, которые могут быть включены. Фактически она хранит конфиг сервисного приложения Search.

А теперь давайте попробуем вернуться к вопросу масштабируемости. Для начала отметим, что SharePoint 2010 Search Server Express подается как решение поиска с одним сервером! Следовательно, все компоненты с рис. 1 будут совмещены на одном-единственном сервере с одним-единственным разделом индекса.

Посчитать его приблизительный размер легко:

TotalIndexSize = CorpusSize * 0.035

Следовательно, проиндексируя 1 Тб документов, мы получим индекс порядка 36 Гб. Вроде немного, но у нас есть четкое ограничение по размеру SQL баз данных, мы же помним о потолке в 10 Гб.

Но размер баз данных тоже считается несложно:

TotalPropertyDBSize = CorpusSize * 0.015

TotalPropertyLogSize = CorpusSize * 0.0031

Выполняя простые вычисления, мы определяем, что после индексирования 1 Тб документов файл базы свойств будет равен 15 Гб, а транзакционный лог – порядка 3 Гб. Так в расчетах мы вышли за допустимые пределы.

Давайте перевернем формулу и попробуем посчитать, какой объем (CorpusSize) нам под силу заиндексировать.

Я оттолкнулся от размера базы в 9,5 Гб.

CorpusSize =  TotalPropertyDBSize  /  0.015

CorpusSize = 9500 Мб / 0.015 =  630 000 Мб = 630 Гб

Ответ: с SQL Express мы можем заиндексировать 630 Гб документов.

Что говорит MS по этому поводу? Что бесплатной версии должно хватить на 300,000 документов. Проверим это утверждение. В моей личной подборке статей и презентаций средний размер офисного документа равен 1 Мб. Следовательно, в 630 Гб войдет порядка 600 тысяч документов.

Вывод: тут компания Microsoft даже поскромничала, указав 300,000 документов, хотя вы всегда сами можете взять средний размер своего документа и прикинуть собственные границы.

Праздновать победу рано, мы забыли еще про две базы данных: Search Crawl Database и Search Administration Database. Сразу откинем Search Administration Database, ее размер гарантировано будет меньше 10 Гб, просто в ней нет столько данных для достижения такого размера.

А вот базу Search Crawl Database легко посчитать:

TotalCrawlDBSize = CorpusSize * 0.046

TotalCrawlLogSize = CorpusSize * 0.011

Смотрим, что получается при тех же вводных данных размером 630 Гб.

TotalCrawlDBSize = 630 000 Мб * 0.046 = 28 Гб.

TotalCrawlLogSize = 630 000 Мб * 0.011 =  7 Гб.

Вывод: выходит, что расчет на 600 тысяч документов оказался неправильным, и его нужно поделить на три? И на выходе мы получим 200 тысяч документов, что даже меньше обещаний вендора?

Я неоднократно проводил расчеты, сравнивал их с реальными показателями и могу поручиться, что расчетные данные являются потолочными и содержат очень и очень хороший запас прочности.

Имейте в виду, что, заменив в данной архитектуре SQL Express на полноценную версию, вы сразу поднимете количество индексируемых документов до границы в 8-10 миллионов штук. А используя данную статью, несложно прикинуть, на что можно рассчитывать в вашем конкретном случае.

Для чего я написал эту статью

Мне очень хочется показать, что SharePoint – действительно интересное направление, которое можно и нужно развивать. Бесплатные версии зачастую позволяют реализовать как совместную работу, так и сервисы для небольших организаций (например, поиск). А самое главное, такие бесплатные версии позволяют специалистам получить необходимый опыт работы с новой платформой и подготовить сотрудников к новым возможностям, не бросая их в океан новых сервисов с перегрузкой информацией, приводящей к ее отторжению. Впоследствии, когда компания будет готова оценить всю мощь платных версий, переход с SharePoint Foundation или SharePoint Server Express не станет чем-то особенным.


Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-41
Fax: (499) 277-12-45
E-mail: sa@samag.ru