Эта страница изготовлена для демонстрации навыков по

Спецкурсу №9 Калинина Б. А.

студентом гр. Фт-523 Сбитневым

Популярные, и не очень, Поисковые Системы

 

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ

1. ПРИНЦИП РАБОТЫ ПОИСКОВЫХ СИСТЕМ

 

1.1.Тематические поисковые системы

1.2. Индексные поисковые системы

 

2. ОБЗОР ПОИСКОВЫХ СИСТЕМ

 

3. РЕЛЕВАНТНОСТЬ

 

3.1. Понятие релевантности

3.2. Приемы повышения релевантности запросов

 

4. ПОИСКОВАЯ СИСТЕМА ЯNDEX

 

4.1. Форма представления результатов

4.2. Операторы запросов Яndex

 

4.2.1. Логические операторы

4.2.2. Весовые операторы

 

4.3. Сервис ИПС Яndex

4.4. Основные ошибки поиска

 

5. ПРИМЕРЫ РЕЗУЛЬТАТОВ ПОИСКА

6. КРАТКИЙ СВОД ПОИСКОВЫХ СИСТЕМ

7. ЗАКЛЮЧЕНИЕ

 

Список принятых сокращений и обозначений:

ИПС – информационно-поисковая система.

БД – база данных.

ВВЕДЕНИЕ

На сегодняшний день "паутина" включает несколько десятков миллионов серверов, на каждом из которых доступно от нескольких мегабайт до десятков гигабайт информации. Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей всех континентов. Интернет – это оперативный доступ к поистине необозримым кладезям информации по любой теме, поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Для ориентирования в столь масштабном информационном пространстве существуют специализированные поисковые сервера.

 

1. ПРИНЦИП РАБОТЫ ПОИСКОВЫХ СИСТЕМ

 

Как уже отмечалось, для поиска бесчисленной информации в Интернете на помощь приходят тематические и индексные поисковые системы.

1.1. Тематические поисковые системы

 

Типичный пример каталога - поисковая система Yahoo (http://www.yahoo.com). Это специализированный сервер WWW, на котором хранятся списки других серверов с их краткими описаниями. Информация сгруппирована по смысловым категориям и имеет иерархическую структуру - например, можно найти на этом сервере разделы "Компьютеры и Интернет -Мультимедиа - Журналы", "Развлечения - Музыка - Группы и исполнители - Элтон Джон", "Страны - Украина - Бизнес в Украине", а также множество других. Предусмотренная на сервере система поиска ищет данные только в каталоге Yahoo и не заглядывает на страницы тех серверов, которые в нем перечислены. Пользоваться такой системой чрезвычайно просто. Надо найти нужный раздел и затем - подходящий сервер по его краткому описанию, которое там приведено. В том или ином виде каталоги предусмотрены практически во всех популярных поисковых системах Интернета. Такие каталоги имеют недостатки: низкая оперативность изменения информации, относительная сложность поиска (по краткому и иногда ошибочному описанию сервера), сравнительно небольшая "область охвата" пространства WWW.

1.2. Индексные поисковые системы

 

Более удобный и эффективный способ поиска необходимых сведений – так называемые индексные поисковые серверы. Принцип действия большинства таких серверов довольно прост. Для поиска информации используется индекс, созданный специальной программой-роботом. При обходе страниц WWW и составлении индекса программы, роботы назначают каждому слову определенное весовое значение, которое выбирается на основании анализа наиболее часто встречающихся слов. Чем чаще встречается слово, тем меньше назначаемый ему весовой коэффициент. Программа-робот периодически обходит известные ей адреса сети, считывает с них хранящиеся там страницы WWW, индексирует все слова со всех страниц (вместе с соответствующими им адресами URL) и помещает их в общий индекс Для хранения этого индекса требуется огромный объем памяти, а для его обработки - значительная вычислительная мощность.

ПРИНЦИП РАБОТЫ ПОИСКОВЫХ СИСТЕМ

Рис. 1.2.1.

 

Например, общий объем хранящихся на сервере Alta Vista, индексных файлов, в которых производится поиск, составляет более 200 гигабайт.

 

2. ОБЗОР ПОИСКОВЫХ СИСТЕМ

Существует несколько чрезвычайно популярных универсальных поисковых серверов, предназначенных для поиска по ключевым словам на возможно большем числе страниц системы WWW.

Достоинства и недостатки поисковых систем складываются из нескольких характеристик. Принципиальным является то, насколько полно та или иная система обследует документы, т.е. все ли слова заносятся в индексные файлы или же только термины из названий, заголовков, первых нескольких строк или страниц текста. Важно также как часто происходит обновление данных, каким образом системы “взвешивают” понятия, определяя степень их соответствия запросу. Не последнюю роль играет простота и удобство интерфейса, а также дополнительные сервисные функции.

В настоящее время наибольшей популярностью пользуются следующие русскоязычные поисковые системы:

 

 

Яndex – поисковая машина последнего поколения, обладающая весьма развернутой, но и достаточно сложной системой формирования запроса. Обладает способностью выделять один документ в различных кодировках, за счет чего сокращается дублирование результатов поиска. В настоящее время декларирована индексация более 30500 российских и зарубежных русскоязычных серверов.

 

Rambler является первой профессиональной российской поисковой системой. Ныне осуществляет поиск более чем по 15000 серверов в пределах бывшего СССР. Имеет неплохие возможности для составления запроса и хороший механизм вывода результатов поиска.

ИПС Апорт индексирует около 13500 российских серверов и делает это весьма основательно. Имеет богатые возможности формирования запроса, в частности, способен выделять сочетания терминов, если они находятся недалеко друг от друга (на расстоянии нескольких слов или предложений). Система способна переводить запрос, а также результат поиска с русского на английский язык и наоборот.

 

3. РЕЛЕВАНТНОСТЬ

3.1. Понятие релевантности

Релевантность найденных результатов – один из важнейших параметров поисковой системы.

Что же такое "релевантность".

Реально, релевантность обозначает соответствие. То есть в случае работы поисковой системы можно сказать так: на ваш запрос к поисковому серверу, вы получаете наиболее соответствующую (релевантную) ему web страницу. Так как крайне редко бывает точное совпадение, поисковый сервер выдает вначале документы с максимальным соответствием (релевантностью), и далее по ниспадающей.

Релевантность документа зависит не только от числа слов запроса, найденных в документе, но и от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Рассмотрим, к примеру, как вычисляется релевантность вашей страницы в запросе Яndex.

•Самый высший приоритет дает заголовок

•Далее наиболее высокий приоритет дается ключевым словам, расположенным в самом верху страницы

•Далее – приоритет количеству повторений/вхождений ключевых слов

 

 

3.2. Приемы повышения релевантности запросов

 Впервые попав на страницы незнакомого поискового сервера, следует в первую очередь прочитать его описание и правила использования, а также изучить предоставляемые им средства и возможности поиска.

В запросе следует использовать те слова, которые точнее всего характеризуют интересующую тему.

Наиболее важные и характерные термины надо размещать в самом начале запроса и добавлять к ним менее значимые термины.

Рекомендуется применение в запросе синонимов.

Не рекомендуется использовать широко распространенные слова типа "компьютер", "информация", "данные" и т.п.

Грамотное использование в запросах логических операторов "И" (AND), "ИЛИ" (OR), "НЕ" (NOT) позволяет сделать поиск чрезвычайно точным и направить его именно туда, куда нужно. Например, на поисковом сервере Alta Vista символы "+" и "-" используют для выделения в запросе обязательных и "запрещенных" слов (по умолчанию все слова запроса считаются объединенными оператором "ИЛИ").

Если среди первых 20-30 ссылок, которые получены от поискового сервера, нет ни одной нужной ссылки, то следует подумать о радикальном изменении набора ключевых слов или об использовании другого поискового сервера.

Таким образом, перед составлением  запроса очень полезно почитать инструкцию поисковой системы. Получив в ответ, например,  10 млн.  ответов, можно попробовать немного изменить запрос, и в верхней части списка  окажутся другие результаты.

4. ПОИСКОВАЯ СИСТЕМА ЯNDEX

Яndex – это информационно-поисковая система с учетом морфологии русского и английского языка. Учет морфологии языка предполагает создание списка всех словоформ, полученных при изменении слова по числам, падежам, родам и временах для всех слов этого языка, и поиск этих словоформ. Яndex предназначен для поика информации в электронных текстах различной структуры и разных способов представления (форматов).

ИПС Яndex совершает предварительную обработку текста, составляя некоторый индекс, по которому затем происходит поиск. Яndex работает с внешними текстами, то есть тексты не втягиваются в систему, а остаются “как есть” – файлами в файловой системе, страницами на сервере или полями какой-то БД. Плюсом данной поисковой системы является также то, что она обладает способностью выделять один документ в различных кодировках, за счет чего сокращается дублирование результатов поиска.

О плюсах этой системы говорит то, что сервер yandex.ru признан лучшим в номинации "Информационно - справочный сайт" на конкурсе "Бизнес-Сайт '98".

 

4.1. Форма представления результатов

Яndex ранжирует документы по вычисляемому параметру "релевантность", начиная с документов с максимальным соответствием и далее по ниспадающей. Внутри документа выделены слова, участвующие в запросе. С каждого такого слова можно перейти на следующее и предыдущее.

Особое внимание Яndex обращает на слова, содержащиеся в заголовке.

4.2. Операторы запросов Яndex

Самый простой запрос состоит из одного слова, например, “карта”. Результатом поиска будут все документы, в тексте которых встречается это слово в какой либо словоформе (карты, картой, карте...). Далее под понятием “слово” будем иметь ввиду “слово и все его словоформы”.

4.2.1. Логические операторы

пробел или & - логическое И (в пределах одного абзаца).

Пример: карта&города

Результат: все документы, где в пределах одного абзаца встречаются слова "карта" и "города"

&& - логическое И (в пределах документа).

Пример: карта&&города

Результат: все документы, где встречаются эти слова.

, или | - логическое ИЛИ.

Пример: карта,города

Результат: все документы, где встречается либо слово " карта", либо слово " город"

- - бинарный оператор И НЕ (в пределах одного абзаца)

Пример: производство-газета

Результат: все документы, где в пределах одного абзаца встречается слово "производство", но не в словосочетании "газета производство"

-- - бинарный оператор И НЕ (в пределах документа)

Пример: производство--газета

Результат: все документы, где встречается слово "производство", но не в словосочетании "газета производство"

( ) - группирование слов

Пример: (карта&&города)-газета

Результат: все документы, где встречаются слова "карта" и "город", но не в словосочетании со словом "газета"

! поиск точной словоформы.

Пример: !карта

Результат: все документы, где встречается слово "карта".

/(число) - расстояние в словах, где "число" – число слов между словами.

Пример: карта/1города

Результат: все документы, где встречается словосочетание "карта города".

Практически все знаки можно комбинировать с ограничением расстояния.

Пример: карта - /+1 города

Результат: документы, содержащие слово 'карта', но не в сочетании "карта города".

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки.

Пример: (холодный, горячий) /+1 (вода | огонь)

Результат: документы, которые содержат любую из фраз "холодная вода", "холодный огонь", "горячая вода", "горячий огонь".

4.2.2. Весовые операторы

слово: число или (поисковое выражение):число – расстановка приоритетов в результатах поиска.

Пример: карта города:5

Результат: те же документы, что и по запросу карта города, но вверху списка найденного, окажутся документы, где чаще встречается именно слово "город".

<- слово или <- (уточняющее выражение)

Пример: компьютер <- телефон

Результат: все документы, содержащие слово 'компьютер', при этом первыми будут выданы документы, содержащие слово 'телефон'.

4.3. Сервис ИПС Яndex

Независимо от того, в какой форме употреблено слово в запросе, по умолчанию учитываются все его формы.

 Например, если задан запрос 'идти', то в результате поиска будут найдены ссылки на документы, содержащие слова 'идти', 'идет', 'шел', 'шла' и т.д.

Для поиска по точной словоформе, перед словоформой надо поставить восклицательный знак '!'.

Если в запросе набрано слово с большой буквы, будут найдены только слова с большой буквы. В противном случае будут найдены как слова с большой, так и с маленькой буквы.

Что такое "искать в найденном"?

Если в результате поиска было найдено слишком много документов следует поставить флажок “искать в найденном”. В этом случае следующий поиск будет вестись по документам, которые были найдены в предыдущем поиске.

Эта возможность особенно удобна, при последовательном сужении области поиска.

Что такое "Найти похожие документы"?

Если в результате поиска оказалось, что один из найденных документов наилучшим образом описывает предмет поиска, нажмите на ссылку “Найти похожие документы”. Поисковая машина Яndex использует этот документ как образец для нового поиска документов, похожих на указанный.

Эта возможность эффективна, если остальные документы в списке найденного существенно меньше отвечают ожиданиям.

Что такое "поиск с обратной связью"?

Если для поиска с обратной связью пометить только один документ - это будет работать в точности так же, как "найти похожие документы".

Этот поиск полезен, когда в списке найденного релевантные документы чередуются с нерелевантными.

Что такое "Открыть первые пять ссылок"?

Одним нажатием на ссылку “Открыть первые пять ссылок” можно открыть пять самых релевантных документов, причем каждый документ появится в отдельном окне.

Что такое "Список серверов"?

В этом списке приведены адреса разных серверов (не более десяти) в порядке их появления в списке найденного. Нажав на значок “первый документ”, Вы откроете в новом окне документ соответствующего сервера, наиболее релевантный запросу.

Используя операторы веса и уточнения запроса, можно повлиять на порядок сортировки.

4.4. Основные ошибки поиска

Для систематизации наиболее часто встречающихся ошибок, совершаемых при работе с поисковой системой, Яndex собирает в особый файл статистики все слова, которые были запрошены, но не найдены.

Итак, первый раздел относится к аббревиатурам. Яndex по-разному работает с маленькими и большими буквами. Если слово набрано маленькими буквами, оно будет искаться во всех вариантах. Если в слове первая буква большая, а остальные маленькие, то будет искаться только такое написание. Если в слове более одной большой буквы, то все сводится к маленьким буквам. Поэтому не дают результата поиск Фсб, Мгимо, Вгтрк. Надо искать фсб (или ФСБ), вгтрк (или ВГТРК).

Кроме этого, часто словосочетания спрашиваются в одно слово, без пробелов: цензурасредствмассовойинформации, комирегиональный, желтыестраницыинтернет, курсдоллара и т.д. Все эти слова не находятся (в отличие от слова "самизнаетекто", которое образовано аналогичным образом, но существует в Интернете).

Ну и, конечно же, в запросе должны быть исключены орфографические ошибки. В английском языке основные проблемы возникают с такими буквами и буквосочетаниями как "c", "k" или "ck"; "e" или "a"; "f" или "ph".

 

5. ПРИМЕРЫ РЕЗУЛЬТАТОВ ПОИСКА

Как известно, в хорошем вопросе содержится половина ответа. Считается, что искать и находить нужное в ворохе интернетовских текстов - умение не только поисковой системы, но и пользователя, задающего запрос.

В этой главе отчета приводится некоторые конкретные результаты поиска нужной информации в Internet. На основании представленных данных можно судить о релевантности поиска в Яndex, о целесообразности уточнения запросов, а также о способах конкретизации исходной информации.

Рассмотрим вполне определенный пример работы с поисковой системой.

Допустим, нам требуется найти в мировой паутине карту Кавказа и информацию об этом районе.

1. Пример запроса: “карта”

Простейший запрос “карта” дает в результате поиска ссылки на 226962 сервера. Естественно, что в таком объеме информации найти нужную будет крайне сложно. Тем более что понятие “карта” имеет несколько толкований. Так, например, семерка наиболее релевантных документов выглядит следующим образом:

1) По звуковым картам.

2) Порядок эмиссии по кредитным картам.

3) Звуковые карты.

4) Звуковые карты.

5) Получение корпоративной карты.

6) Порядок эмиссии по кредитным картам.

7) Принтер для печати на пластиковых картах.

То есть ни один из приведенных документов не соответствует желаемому результату, запрос нуждается в уточнении.

2. Пример запроса: “карта района”.

Результат: ссылки на 2414 сайтов, наверху списка которых находятся следующие документы:

Карты районов Крыма.

Карты районов Крыма. Севастополь.

Город – карта районов.

Город – карта районов.

Карты районов Крыма. Феодосия.

Город – карта районов.

Город – карта районов.

Следует отметить, что в документе “Карты районов Крыма” содержится информация обо всех горных массивах бывшего СССР, в том числе и о Кавказе.

Также следует отметить, что изменение запроса на “карта&&района” не дает никаких изменений в списке найденного. Изменение же запроса на “”карта района”” (или “карта+района) существенно сокращает число найденных материалов (до 572), однако “верхушка” представленного списка остается практически той же самой.

Карты районов Крыма.

Карты районов Крыма. Бахчисарайский район.

Обзорная карта района работ.

Город – карта районов.

Город – карта районов.

Город – карта районов.

Город – карта районов.

Можно видеть: такое уточнение не дает заметного эффекта, благодаря тому, что документы, где ключевые слова находятся рядом обладают наибольшей релевантностью. Это существенно упрощает поиск в Яndex.

Однако в этом списке все таки имеется много “мусора”. Можно попробовать сузить область поиска, исключив, например, в запросе слово “город”.

3. Пример запроса: “(карта района)-город”.

Результат: 258 документов. Первые семь из них:

Карты районов Крыма.

Крым: карты севера.

Общегеографические карты Челябинской области.

Общегеографические карты Челябинской области.

Маршруты и карты.

Карты и восхождения бывшего Союза.

Туризм. Экзамен на лесной тропе.

Дальнейшее уточнение “(карта района)-город-область” хотя и приводит к сокращению числа ссылок, но уже не играет особой роли.

Рассмотрим пример использования синонимов в запросах.

Пример: на запрос “карта района -город -область” Яndex выдает 450 ссылок на различные сайты, а на запрос “схема района -город -область” - только 79.

 

6. КРАТКИЙ СВОД ПОИСКОВЫХ СИСТЕМ

                                                     
         Существует несколько чрезвычайно популярных универсальных поисковых серверов, предназначенных для поиска по ключевым словам на возможно большем числе страниц системы WWW. Достоинства и недостатки поисковых систем складываются из нескольких характеристик. Принципиальным является то, насколько полно та или иная система обследует документы, т.е. все ли слова заносятся в индексные файлы или же только термины из названий, заголовков, первых нескольких строк или страниц текста. Важно также как часто происходит обновление данных, каким образом системы "взвешивают" понятия, определяя степень их соответствия запросу. Не последнюю роль играет простота и удобство интерфейса, а также дополнительные сервисные функции.
          В настоящее время наибольшей популярностью пользуются следующие поисковые системы:

Зарубежные поисковые системы

Достоинства

Недостатки

Yahoo!

Эта служба - пионер среди поисковых систем. Информация каталогизирована по ножеству разделов и представлена в виде дерева. Сервер содержит все необходимые средства для поиска с возможностью фильтрации. Каталог Web и интерфейс для обращения к полнотекстовому поиску на сервере Alta Vista

Полнота списка категорий; простота поиска; отлично работает функция устранения повторяющихся ссылок

Встречаются устаревшие ссылки

Alta Vista

Один из самых больших и самых быстрых поисковых серверов. Предоставляет несколько способов поиска более чем 8 млрд. ключевых слов на 16 млн. Web-страниц. Также доступен индекс более чем 13 000 групп новостей. Позволяет осуществлять поиск на русском языке.

Быстрота; большой индекс, позволяющий найти много страниц; изощреннейшие возможности расширенного поиска; правильное индексирование русскоязычных ресурсов; наличие русской версии; возможность работы с учетом морфологии русского языка; имеется функция "похожие страницы"; хорошо работает фукция устранения повторяющихся ссылок

Слабое ранжирование. Ранжирование определяет порядок выдачи результатов поисковым сервером Страницы, на которых запрошенные слова встречаются чаще, получают более высокий ранг и выводятся первыми.

Web Crawler

Поисковый сервер, имеющий также аннотацию узлов. Сравнительно недавно появившаяся система, но с объемной базой и неплохими средствами поиска.

Простота в обращении; относительная быстрота; имеется фукция "похожие страницы"; отлично работает фукция устранения повторяющихся ссылок.

Менее обширная база узлов, чем на других поисковых серверах

Infoseek

Еще одна достаточно мощная поисковая система, которая, по отзывам многих пользователей, помогала находить то, что другим службам было "не по зубам". С простым в пользовании поисковым сервером плюс каталог Web с аннотациями узлов

Широкий охват тем; большое число полезных вспомогательных инструментов; настраиваемая страница новостей (доступ через InfoSeek Personal)

Менее полные, чем на других серверах, результаты поиска; плохо организован интерфейс

HotBot

Очень быстрый поисковый сервер, осуществляющий поиск по методу Inktomi. Самая свежая информация! HotBot - поисковая система, имеющая самую часто обновляющуюся информационную базу ссылок.

Быстрый с аккуратным интерфейсом; возможность строить расширенные запросы с помощью мыши; правильное индексирование русскоязычных ресурсов; хорошо работает функция устранения повторяющихся ссылок

Сравнительно бедный индекс; трудоемкое построение сложных запросов

Galaxy

Малоизвестная, но в то же время достаточно мощная поисковая система.

Magellan

Каталог и поисковый сервер с ориентацией на семейные интересы. Помимо непосредственного поиска предоставляются обзоры Web-страниц, а также FTP- и Gopher-архивов и групп Usenet.

Большое число аннотированных узлов; оценка узлов; зеленый светофор отмечает узлы, которые разрешается посещать детям

Медлительность; ограниченные возможности построения расширенных запросов

Excite

Быстрый и богатый информацией поисковый сервер с обзорами узлов и путеводителями. Выполняет концептуальный поиск, а не только поиск по ключевым словам. Содержимое базы данных обновляется еженедельно. В базе данных, как утверждают, содержится информация по более чем 1,5 млн. Web-страниц, обзоры более чем 50 000 Web-страниц и новости Usenet. Предоставляет доступ к City.Net и к новостям Reuters.

Хорошее ранжирование, облегчаемое технологией концептуального поиска; мощные возможности настройки на пользователя; имеется функция "похожие страницы"; хорошо работает функция устранения повторяющихся ссылок

Малое по сравнению с Yahoo и Magellan число аннотированных узлов

Lycos

Один из первых поисковых серверов Web, уступил первенство серверам Alta Vista и Excite. Одно из лучших средств поиска, позволяющее искать не только текст, но и графику и видеофрагменты.

Обширный индекс, покрывающий значительную часть Web; каталог A2Z с аннотациями множества узлов; отлично работает функция устранения повторяющихся ссылок

Медлительность; частое появление в результатах поиска устарелых сведений

Nexor

Достаточно мощная поисковая система.

MCI Internet

Неплохая поисковая система с удобным интерфейсом .

 

 

Eye on the Web

Каталог Web, отражающий пристрастие создателей

Возможность настройка на пользователя, привлекательная графика

Сравнительно с другими каталогами плохо отображены небольшие узлы

OpenText

Поисковый сервер. Выполняет поиск по всем ключевым словам на всех WEB-страницах среди более чем 21 млрд. слов и фраз. Считается одним из крупнейших доступных поисковых индексов. Возможно указание запросов практически неограниченной длины.

Достаточно быстрый поиск; просмотр контекства употребления искомого термина в тексте; имеется функция "похожие страницы"

Небольшая загруженность текстом поисковой страницы

WiseWire

Поисковый агент нового типа, учитывающий предпочтения пользователя и осуществляющий поиск с применением искусственного интеллекта

Настройка поиска и обратная связь

Сложность конфигурирования; необходимость предварительного обучения

WWW Virtual Library

Предпринятая энтузиастами попытка систематизировать информацию в WWW с академическим уклоном

Наличие тем, которых нет ни в каких других каталогах, таких как исследование солнечной атмосферы или микология

Отсутствие поискового сервера; необходимость запастись терпением для работы с систематическим каталогом

Deja News

Считается наиболее мощным средством поиска в группах новостей Usenet. Поиск может выполнять по дате, автору, теме или группе.

Обилие возможностей расширенного поиска; полезные фильтры для "очистки" результата

Формально-логический синтаксис запросов, любезный разве что сердцу программистов, пишущих на С++

Русскоязычные поисковые системы

Язык запроса

Вывод

Rambler

Cистема, созданная специально для выявления материалов на серверах в пределах бывшего СССР. Обеспечивает полнотекстовый поиск более чем на 350 тысячах страниц 39000 отечественных узлов, кроме того, обследуется также недельный архив телеконференций Релком.

AND, OR, NOT. Возможность усечения терминов. Ограничение по дате

Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка

Созвездие Интернет

Справочно-поисковая система по информационным ресурсам, классифицированным по разделам. Основной раздел сервера включает разделы "Компьютеры и технологии", "Экономика и бизнес", "Медицина и здоровье", "СМИ", "Образование и культура", "Образование и наука", "Техника и транспорт", "Отдых и развлечения" и "Разное".

Возможность усечения терминов

Название сервера, краткая характеристика содержания, кодировки

Апорт!

Главная отличительная черта - забота об удобстве пользователя. Сервер предоставляет широкие возможности составления запроса. Помимо традиционных операторов "или"и "и", усечения окончаний и поиска по целой фразе, система обладает способностью вычленять сочетания терминов расположенных рядом друг с гругом.

AND и OR, поиск по фразе, возможность усечения, чувствительность к строчным и прописным буквам, учет русской морфологии

Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка

Visti

Сервер выполняет поиск по базе украинских web-серверов, поиск по базе реферативных описаний web-серверов, поиск по украинским USENET-конференциям.

CompTek

Полнотекстные поисковые системы, позволяющие вести поиск с полным учетом морфологии русского языка.

Э-Росс

У нас собирается персональная информация по электронным адресам людей, их домашним www страничкам, телефонам и т. д.

Russia on the Net

Полнотекстовая поисковая система. Область просмотра охватывет 60 наиболее информативных российских сервера. Англоязычный каталог русского WWW. Поиск либо по категориям, либо по описаниям серверов

Поиск по ключевым словам

Название сервера, краткое описание, язык сервера

Яndex-Web

Поиск на естественом языке и "академический" поиск. На каждой странице возможен поиск с логическими операторами. Русская часть Интернет, включая домены "su" и "ru", а также русскоязычные ресурсы в других доменах. Все слова в документе с учетом русской и английской морфологии

AND, OR, NOT. Поиск по точной словоформе. Возможность поиска с расстоянием. Поддержка скобочных выражений. Поиск в заголовках и ссылках. Есть возможность поиска на естественном языке без использования логических операторов

Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка. Подстветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах

Новый русский

WWW Некоммерческие конференции Relcom за последние две недели. Все слова в документе.

AND, OR, NOT. Поиск по словосочетанию

Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу

Русская машина

WWW Все слова в документе

AND и OR. Поиск по фразе, допуск максимального количества ошибок, чувствительность к строчным и прописным буквам

Название документа, URL, степень соответствия запросу

Паук

Требует пароля. WWW Название, первые строки и электронный адрес документа

Возможность усечения терминов

Название сервера, URL

Russian Internet Search

WWW Все слова в документе

AND и OR, чувствительность к строчным и прпописным буквам, допуск возможного числа ошибок

Название документа, URL

TELA-ПОИСК

WWW Все слова в документе

AND и OR, возможность усечения терминов, русская морфология

Название документа, размер страницы и число слов URL, дата последнего обновления, степень соответствия запросу (очки). Интересная возможность просмотреть содержание найденного документа (без картинок) прямо со страницы поисковой системы

Ау!

Каталог русского WWW. Поиск либо по категориям, либо по описаниям серверов

Аналогично Апорт!

Название сервера, краткое описание, местоположение, доступность

The List of Russian Web Servers

Каталог WWW. Поиск либо по категориям, либо по названиям серверов

Возможность поиска по названию, URL, группам, используемым кодировкам, языку сервера, географическому расположению

Название документа

Следопыт - интеллектуальная метапоисковая машина

Консолидатор поиска. Передает запрос в несколько популярных поисковых систем

Кроме стандартных операторов может быть использован перевод запроса или поиск словоформ

При выдаче результатов поиска указано от какого сервера пришел ответ

THE DIGITAL MOSCOW SOFTWARE CENTER

Как указано на первой странице сервера: This is the first official Alta Vista site in Russia

Аналогично Alta Vista

Аналогично Alta Vista

Se@rch

Каталог WWW

Название сервера, краткое описание, есть возможность продолжить поиск по указанному слову в поисковой системе Rambler

Каталог ресурсов Интернет Улитка

Каталог WWW

Неприменимо

Название сервера

Специализированные

Music Search

Сервер содержит большую базу музыкальной тематики

shareware.com

Средство поиска бесплатных и условно бесплатных программ (shareware) в Интернет. Содержит ссылки на более чем 170 000 файлов, расположенных в различных архивах по всему миру.

FTP

Поиск файлов на FTP-серверах

Who Where?

Быстрое и удобное средство для поиска людей и организаций. Имеется возможность обработки неверно введенных или неполных имен и инициалов.

ChipInfo

На сервере содержится информация о большинстве микросхем, выпускавшихся когда-либо. Есть возможность получения подробных сведений.

HI-FI

Сервер содержит огромное количество сведений об аудиотехнике класса hi-fi.

Промэлектроника

Здесь содержится информация по изделиям микроэлектронной техники - от резисторов до процессоров.

Кулинарный поиск!

Система индексирует все (известные авторам) русские кулинарные ресурсы

            В наше время информация играет огромную роль во всех сферах жизнедеятельности. Людям, имеющим дело с большими объемами текстов - это и новости, и подшивки газет в электронном виде, и электронная почта, и Web-страницы, важно быстро находить в этом море информации действительно нужную. Без помощи поисковой системы это было бы нереально. Благодаря удобству в обращении и хорошим техническим характеристикам, различные поисковые системы могут помочь в этом и новичку, и опытному пользователю.
            Поисковые системы и существующие к ним приложения, способны облегчить работу представителей многих профессий: Web-мастера, аналитика, руководителя, лингвиста.  Информационный бум продолжается, происходит дальнейшее развитие электронно-компьютерных технологий, а следовательно и в будущем без поисковых систем обойтись будет крайне сложно.

 

 

7. ЗАКЛЮЧЕНИЕ

В наше время информация играет огромную роль во всех сферах жизнедеятельности. Людям, имеющим дело с большими объемами текстов – это и новости, и подшивки газет в электронном виде, и электронная почта, и Web-страницы, важно быстро находить в этом море информации действительно нужную. Без помощи поисковой системы это было бы нереально. Благодаря удобству в обращении и хорошим техническим характеристикам, Яndex может помочь в этом и новичку, и опытному пользователю.

Яndex и существующие к нему приложения, способен облегчить работу представителей многих профессий: Web-мастера, аналитика, руководителя, лингвиста.

Информационный бум продолжается, происходит дальнейшее развитие электронно-компьютерных технологий, а следовательно и в будущем без поисковых систем обойтись будет крайне сложно.

(c) Copyright поставил Сбитнев