Занятие 1. Знакомство с Index Server

(Продолжительноcть занятия 20 минут)

Microsoft Index Server поддерживает индексирование содержимого узла под управлением Internet Information Server и поиск информации в документах, хранящихся на узле. На этом занятии Вы познакомитесь с возможностями Index Server и его требованиями к системным ресурсам.


Изучив материал этого занятия, Вы сможете:


Microsoft Index Server позволяет индексировать документы, хранящиеся на Вашем узле, и предоставлять клиентам возможность поиска информации в них. Он индексирует текст и свойства документов и, пользуясь построенными индексными файлами, поддерживает поиск в документах с помощью запросов. Запрос создается при заполнении полей формы Web-запроса в любом Web-обозревателе.

Вы можете использовать Index Server для индексирования документов в интрасетях и на любых жестких дисках, доступных по UNC-пути. Index Server способен индексировать документы, находящиеся на нескольких Web-узлах, созданные на разных языках и хранящиеся в файлах различных форматов. Index Server автоматически обновляет индексы при изменении исходных файлов.

Возможности Index Server

Index Server позволяет индексировать файлы нескольких Web-серверов — для этого достаточно вьделить папку на удаленном компьютере в совместное использование и создать виртуальный каталог на сервере индексирования. Точно также Вы сможете индексировать и файлы, расположенные на серверах Novell NetWare или на разделах FAT.

Index Server способен также индексировать содержание и свойства форматированных документов (например, созданных в Microsoft Word или Microsoft Excel), что позволяет публиковать такие документы в интрасети непосредственно, без предварительного преобразования в формат HTML. Index Server индексирует файлы следующих форматов:

Связи OLE также индексируются. Установив дополнительные фильтры содержания, поставляемые независимыми разработчиками, Вы расширите число файловых форматов, которые могут быть индексированы. Такой фильтр считывает документ соответствующего формата, выделяет из него текст и свойства и передает их Index Server для индексирования. Index Server способен также индексировать NNTP-документы, хранящиеся на сервере новостей. Index Server в настоящее время поддерживает индексирование и запросы на следующих языках:

Index Server позволяет индексировать многоязычные документы и переключаться между языками по мере необходимости. Например, он может проиндексировать абзац на английском, затем абзац на французском и затем снова переключиться на английский. Вся индексная информация хранится в кодировке Unicode, а все запросы перед их обработкой также преобразуются в эту кодировку.

После того как Вы установите и запустите Index Server, он автоматически проиндексирует все файлы Вашего Web-узла Internet Information Server. При изменении файлов узла Index Server автоматически обновит индекс. В состав Index Server включены средства автоматического исправления наиболее распространенных орфографических ошибок.

Использование Index Server

Index Server устанавливается на компьютер под управлением ОС Microsoft Windows NT Server 4.0 с помощью программы Setup из состава Windows NT 4.0 Option Pack. Если Вы устанавливали Internet Information Server в соответствии с инструкциями, приведенными в главе 2, «Установка IIS», Index Server уже установлен.

Требования к ресурсам системы

Программные файлы Index Server требуют от 3 до 12 Мб дискового пространства в зависимости от числа поддерживаемых языков. Для данных Index Server потребуется дополнительное место на диске; объем определяется числом и типом индексируемых документов. Данные Index Server могут занимать до 40% от общего размера индексируемых документов. Хотя среднее значение объема используемого дискового пространства около 30%, в отдельных случаях может достигаться и 40-процентный рубеж.

Другими словами, для узла, обеспечивающего поддержку нескольких языков и нуждающегося в индексировании файлов общим объемом 100 Мб, может потребоваться 52 Мб дополнительного дискового пространства (40 % от 100 Мб = 40 Мб+12 Мб для программных файлов).


Примечание По соображениям безопасности компания Microsoft рекомендует хранить данные Index Server на разделе NTFS. Использование NTFS является одним из ключевых факторов обеспечения безопасности Internet Information Server и Index Server, так как NTFS позволяет ограничивать доступ к файлам и папкам.


Минимальные требования к конфигурации системы, предъявляемые Index Server, обычно совпадают с требованиями Microsoft Windows NT Server 4.0, однако конфигурация, соответствующая оптимальной производительности, определяется следующими факторами:

Компьютер на базе процессора 486/DX4-100 с 32 Мб ОЗУ, работающий под управлением ОС Windows NT Server 4.0, справляется с обработкой запросов, лишь если их число в один момент времени не слишком велико. Такой аппаратной конфигурации достаточно для маленькой организации, но для обслуживания большого числа пользователей придется установить Index Server на более мощном компьютере.

Приведенная ниже таблица поможет Вам оценить, какой объем памяти необходим для работы Index Server в Вашей организации.

 
Число документов Рекомендуемый объем памяти (в мегабайтах)
Менее 100 000 32
100 000 - 250 000 64 - 128
250 000 - 500 000 128 - 256
500 000 и более 256 и более

Более мощный процессор и больший объем памяти значительно увеличивают производительность операций индексирования и обслуживания запросов. Если число документов велико, нехватка памяти серьезно уменьшает быстродействие. Если во время работы Index Server Вы заметили спад производительности, воспользуйтесь утилитой Performance Monitor для определения его причин.

Изменения конфигурации в результате установки

При установке Index Server Вы задаете папку каталога. Каталог (catalog) — это высший организационный уровень иерархии папок Index Server. Программа Setup создает в указанной папке каталога папку CATALOG.WCI, где будут храниться индексы и кэш свойств. Эта папка может занимать до 40% от общего объема совокупности индексируемых файлов, поэтому разместите ее на разделе, где достаточно свободного места.

Во время установки файлы Index Server копируются в следующие папки Вашего компьютера:

После установки запускается служба Content Index (Cisvc.exe), которая выполняет индексирование всех документов в каждом из виртуальных каталогов Webсервера на базе Internet Information Server, включая виртуальные каталоги для удаленных ресурсов.

Index Server запускается автоматически при включении Internet Information Server. Средствами апплета Services Панели управления Вы можете проверить, запустилась ли служба Content Index. Если нет, запустите ее вручную, выбрав ее и нажав кнопку Start. Работа Index Server не завершается автоматически при закрытии Internet Information Server.

После выполнения первоначального индексирования служба Content Index будет определять только новые и изменившиеся документы сервера под управлением Internet Information Server. Вы можете добавить новые документы в уже существующие виртуальные каталоги, либо добавить новые виртуальные каталоги и поместить документы в них. Служба Content Index отслеживает и индексирует все виртуальные каталоги сервера, даже когда служба World Wide Web (WWW) не работает.

Резюме

Microsoft Index Server позволяет индексировать документы, хранящиеся на узле Internet Information Server, и поддерживает контекстный поиск в этих документах. Index Server способен индексировать многоязычные документы различных форматов, хранящиеся на нескольких Web-серверах. Он также автоматически обновляет индекс при изменении исходных файлов. Минимальные требования к конфигурации системы для Index Server обычно совпадают с требованиями, предъявляемыми Microsoft Windows NT Server 4.0. Вы можете запускать Index Server и прекращать его работу средствами апплета Services Панели управления.

Используются технологии uCoz