Helgus ~ µастер ~ Kласс: Это незавершённая статья по ивентологии и её применениям |
Информационно-поисковая система (ИПС) — это cистема, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска. Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего из ничего. Поэтому вводится качественная характеристика процедуры поиска — релевантность.
Релевантность — это соответствие результатов поиска сформулированному запросу.
Типы ИПС[]
Каталог[]
Каталог — поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми. Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса. Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник. Адреса популярных каталогов:
Зарубежные каталоги[]
Российские каталоги[]
Поисковая машина[]
Поисковая машина — поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.
Отличительной чертой Поисковая машина является тот факт, что база данных, содержащая информацию об Web-страницах, статьях Usenet и т.д., формируется программой-роботом.
Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы, заключенной в кавычки. Индекс формируется и поддерживается в актуальном состоянии роботами-индексировщиками.
В описании документа чаще всего содержится несколько первых предложений или выдержки из текста документа с выделением ключевых слов. Как правило, указана дата обновления (проверки) документа, его размер в килобайтах, некоторые системы определяют язык документа и его кодировку (для русскоязычных документов).
Зарубежные поисковые машины[]
Российские поисковые машины[]
Метапоисковая машина[]
Метапоисковая система. Различные поисковые системы описывают разное количество источников информации в Интернет. Поэтому нельзя ограничиваться поиском только в одной из указанных поисковых системах. Теперь познакомимся с инструментами поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем. Это метапоисковые системы (поисковые службы) — системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.
Адреса известных метапоисковых систем[]
Автоматизированные библиотечные информационные системы[]
АБИС «Руслан»[]
АБИС «Руслан» обеспечивает автоматизацию всех основных процессов обработки литературы и обслуживания читателей в библиотеках различного профиля. Функциональность АБИС «Руслан» может наращиваться постепенно, путем добавления новых модулей без модификации или замены уже приобретенных. Это обеспечивает возможность поэтапного внедрения системы.
АБИС «Руслан» делает возможным создание электронных библиотек полнотекстовых ресурсов, обеспечивает создание в короткие сроки библиотечных консорциумов и вовлечение в их деятельность отдельных библиотек. Система поддерживает возможность кооперации в режиме он-лайн со всеми библиотеками, использующими эту систему для выполнения операций каталогизации заимствованием (при вводе новых поступлений и проведении ретро-конверсии), для поиска и заказа документов.
АБИС «Руслан» не имеет ограничений на количество подключенных АРМов, на количество одновременно работающих пользователей, на количество библиотечных баз данных, на количество записей в БД.
Общие принципы организации системы[]
- Открытые стандарты — применение стандартных протоколов взаимодействия и форматов данных (стандарты ISO, рекомендации национального уровня, стандарты де-факто).
- Распределенная среда — возможность работы системы в любой сетевой среде — локальной, корпоративной или глобальной сети в зависимости от решаемых системой задач.
- Интернет/Интранет и Web технологии — использование Интернет в качестве транспортной среды, а также реализация доступа пользователей через Web браузер.
- Многоуровневая архитектура «клиент-сервер» — система состоит из СУБД, сервера приложений (сервер «Руслан») и клиентской части (АРМы).
Особенности системы[]
- Открытость — система поддерживает взаимодействие с внешними библиотеками и ресурсными центрами по протоколу Z39.50, причем эти возможности встроены в АРМы, т.е. не требуют дополнительных операций и дополнительных компонентов для установления связей в внешними источниками данных.
- Каталогизация заимствованием — эффективное средство повышения качества работы библиотеки. При поступлении книги в библиотеку имеется возможность найти ее описание в авторитетных внешних источниках, например, в текущей государственной библиографии на сервере Российской книжной палаты[12] (ежедневно пополняемой). Вы можете выполнять одновременный поиск сразу на нескольких серверах Z39.50. После чего запись редактируется и добавляется в электронный каталог.
- Поддержка UNICODE — можно использовать несколько языков при создании библиографического описания. Поддерживаются любые языки, в том числе национальные языки России (татарский, башкирский, чувашский и др).
- Удаленная работа читателя — читатель может выполнять поиск и заказ документов через любой компьютер, подключенный к Интернет.
- Удаленная работа сотрудника — поддерживаются решения для многофилиальных библиотек, когда операции комплектования/каталогизации и книговыдачи могут выполняться в удаленных филиалах (другое здание, другой город, другой провайдер Интернет) с размещением всех данных в центральном хранилище сервера «Руслан».
- Гибкость и адаптивность — обеспечивается настройка на особенности библиотеки без изменения программного кода, используя механизмы шаблонов, конфигурационные файлы и параметры системы.
АБИС Greenstone[]
Greenstone — эффективное Open Source-решение для построения цифровых библиотек (ЦБ). Система обеспечивает поиск с предварительным индексированием по документам всех популярных форматов и, прежде всего doc и pdf, которые могут быть представлены в заархивированном виде. Система создает каталог документов, конвертирует их в xml-формат, а затем обеспечивает отдаленный доступ к библиотеке посредством браузера. Greenstone — комплексная система для построения и распространения коллекций ЦБ. Она обеспечивает способ организации и публикации информации в Интернете (или на CD-дисках). Следовательно, система Greenstone может решить задачу сохранения и извлечения в электронном виде периодических изданий и удовлетворить потребность научных работников в получении информации о периодическом издании, выпуске периодического издания или публикации. ПО Greenstone разработано на факультете компьютерных наук университета Вайкато в Новой Зеландии в рамках проекта по созданию цифровых библиотек. Руководитель проекта — Ян Виттен (Ian H. Witten). Разработка проводилась при содействии ЮНЕСКО и неправительственной организации Human info[13]. Распространяется с ноября 2000 года. В настоящее время Greenstone постоянно дорабатывается. Программа свободно доступна на сайте Greenstone[14] и отвечает условиям GNU. Существует две версии Greenstone — локальная и сетевая. Система работает на платформах Windows и Unix с использованием стандартных Web-серверов. В настоящее время Greenstone широко используется многими организациями разных стран. На упомянутом выше сайте имеются ссылки на более чем 20 коллекций цифровых библиотек Greenstone. ПО Greenstone предоставляет возможности:
- создавать коллекции электронных документов;
- детально определять документы в зависимости от метаданных;
- сохранять десятки Гб текста и связанных с ним изображений;
- осуществлять полнотекстовый поиск, а также поиск и просмотр документов по полям метаданных;
- документы, которые вносятся в коллекцию, и их метаданные могут иметь разные форматы;
- осуществлять обработку документов на каком-либо языке и поддерживать многоязычный интерфейс пользователя;
- организовывать и публиковать информацию в Интернете или на компакт-дисках;
- использовать стандартные и нестандартные метаданные для описания содержания документов.
Структуризация содержания обычных документов на части, главы, разделы и т.д. представляется в документах Greenstone в виде иерархической структуры разделов Greenstone. Структура документа может использоваться при формировании поисковых индексов. Если входные документы не имеют структуры, то в коллекции Greenstone они могут быть представлены в виде последовательности страниц, что позволяет просматривать документы постранично.
В системе используется набор символов UNICODE. В связи с этим и документы, и внешний интерфейс могут представляться на разных языках. В этом смысле система Greenstone является многоязычной. Кроме того, систему легко расширить новым языком интерфейса, путем добавления соответствующих названий и описаний элементов интерфейса на желаемом языке в файлы конфигурации.
ИРБИС[]
Система автоматизации библиотек ИРБИС представляет собой типовое интегрированное решение для автоматизации библиотечных технологий и предназначена для использования в условиях библиотек любого типа и профиля. Она ориентирована на работу в локальных вычислительных сетях любого типа без ограничения количества пользователей. Система полностью совместима с международными форматами UNIMARC и USMARC на основе средств двухсторонней конверсии данных, а также поддерживает Российский коммуникативный формат RUSMARC.
ИРБИС позволяет создавать и поддерживать любое количество баз данных, составляющих Электронный каталог (ЭК) или представляющих собой проблемно-ориентированные библиографические базы данных (БД). Система предлагает технологию автоматического формирования словарей, на основе которых реализуется быстрый поиск по любым элементам описания и их сочетаниям. Средства каталогизации позволяют обрабатывать и описывать любые виды изданий, включая нетрадиционные, такие как аудио- и видеоматериалы, компьютерные программы и файлы, картографические материалы, ноты и т.д.
ИРБИС включает технологии, ориентированные на использование штрих-кодов на экземплярах изданий и читательских билетах, включает средства, которые позволяют использовать в качестве иллюстративного материала любые внешние по отношению к библиографическому документу объекты, такие как полные тексты, графика, таблицы, аудио- и видеоматериалы, а также ресурсы сети Интернет. В системе предусмотрены средства, позволяющие вводить и отображать символы, не входящие в стандартный (выбранный) кодовый набор, в частности, диакриты европейских языков, греческие буквы и другие специальные символы. Система предлагает большой набор сервисных средств, обеспечивающих удобство и наглядность пользовательских интерфейсов, упрощающих процесс ввода, исключающих ошибки и дублирование информации.
Система является в достаточной мере открытой, что позволяет пользователю самостоятельно вносить изменения в широких пределах: от изменения входных и выходных форм до разработки оригинальных приложений.
Примечания[]
- ↑ http://www.yahoo.com
- ↑ http://www.mckinley.com
- ↑ http://www.aport.ru
- ↑ http://www.weblist.ru
- ↑ http://www.google.com
- ↑ http://www.altavista.com
- ↑ http://www.excite.com
- ↑ http://www.yandex.ru
- ↑ http://www.rambler.ru
- ↑ http://www.metacrawler.com
- ↑ http://www.savvysearch.com
- ↑ http://www.bookchamber.ru/
- ↑ http://humaninfo.org/home_flash.html
- ↑ http://greenstone.org
Литература[]
- Ашманов И.С., Иванов А.А. — Продвижение сайта в поисковых системах
- Ландэ Д.В. — Эффективный поиск знаний в Интернет.
См. также[]
- Поисковая система
- Поисковая машина
- Информационный поиск
- Поисковая оптимизация
- Списки библиотек и поисковые системы