Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота базы, учёт морфологии языка.
Классификация[]
По области поиска(условно)[]
Локальные[]
Предназначены для поиска информации по какой-либо части всемирной сети, например по одному или нескольким сайтам, либо по локальной сети.
Глобальные[]
Предназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем Google,Yahoo и т. д.
Поисковые машины осуществляют поиск информации различного типа, например текстов, видео, изображений, географических объектов, персональных данных и др.
При этом файлы, с которыми может работать поисковая машина, могут быть как текстового формата (например .html,.htm,.txt,.doc,.rtf, …), так и графического (.gif, .png, .svg, …) или мультимедийного (видео, звука и другой информации).
Пока наиболее распространённым является именно поиск по текстовым документам. Такими документами могут быть web-страницы, документы в формате doc, rtf, txt и др.
В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Поиск по изображениям, видео, звукам более сложен с технологической точки зрения, поэтому массово не реализован. Такие системы, как, например, Яндекс.Картинки, на момент написания статьи искали не по самим изображениям, а по альтернативным текстам, соответствующим этим изображениям.
Поисковый запрос[]
Исходной информацией для поиска является поисковый запрос.
Функции[]
Поисковые машины выполняют несколько функций:
Поиск ссылок[]
На страницы и другие документы сайтов
Автоматически[]
Поисковая машина ищет ссылки со страниц сайтов.
Ручной режим[]
Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов
Индексация документов сайтов[]
Извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины
Поиск по базе данных проиндексированных документов[]
Может состоять из нескольких этапов
Нахождение документов, соответствующих поисковому запросу[]
Ранжирование документов в соответствии с их релевантностью поисковым запросам[]
Кластеризация документов[]
Примеры[]
- Sphinx — созданный в России бесплатный поисковой движок с открытым кодом. Используется на Dailymotion, Mininova, ThePirateBay, NetLog, и т.д. //Источник - LOR
Примечания[]
См. также[]
- Информатика
- Список поисковых машин
- Поисковая система
Ссылки[]
- Страница 0 - краткая статья
- Страница 1 - энциклопедическая статья
- Разное - на страницах: 2 , 3 , 4 , 5
- Прошу вносить вашу информацию в «Поисковая машина 1», чтобы сохранить ее