некоторые ссылки на поисковые системы
Сервер Rambler компании Stack является одним из самых больших и наиболее известных поисковиков русской Internet. Спайдер Rambler индексирует сайты, расположенные в доменах СНГ. Система содержит миллионы документов с более чем 15 тыс. Web-узлов, имеет в среднем 500 тыс. хитов в день, а над поддержкой всего этого проекта трудятся около сотни специалистов. Рейтинг Rambler Top 100 очень часто используется многими компаниями как показатель авторитетности тех или иных ресурсов. Даже широко известный http://www.anekdot.ru/ для определения количества посещений пользуется услугами счетчика Rambler. Rambler предоставляет посетителям множество услуг: позволяет, например, увеличивать или уменьшать значимость отдельных слов в ключевой фразе с помощью символов "+" и "--", облегчает поиск в адресах URL, заголовках страниц и даже в нескольких абзацах в начале документа. С помощью данной системы можно легко находить "похожие" страницы, осуществлять повторный поиск адресов среди уже найденных. В ответ на запрос Rambler выдает клиентам список ссылок, снабжая каждую из них небольшой аннотацией, из которой вы узнаете кодировку документа, его размер, дату создания/обновления, а также прочтете фрагмент предложения с искомой ключевой фразой.
Поисковая система "Апорт!" принадлежит компании "Агама" и разрабатывается при поддержке Intel. Поиск в "Апорт!" ведется по базе данных, содержащей свыше двух миллионов документов, оригиналы которых расположены на более чем 13 тыс. серверов. Система может искать необходимую информацию по различным словоформам введенных слов, исправлять в них ошибки, поддерживает поиск по фразам, в ней легко указать ограничение в расстоянии между фрагментами текста, заданное нужным количеством слов или фраз, а также допустимый временной период создания документов. Возможен поиск по адресам URL, заголовкам документов, подписям к картинкам, ссылкам и комментариям. Более того, система может осуществлять автоматический перевод с русского на английский и с английского на русский не только ключевой фразы при запросе, но и полученной в результате информации. Итоги поиска упорядочиваются по частоте использования искомых терминов в документе.
Сайт Яndex, принадлежащий компании CompNet, является одним из самых динамично развивающихся проектов в РуНете. В нем поиск ведется более чем по 30 тыс. серверов, проиндексировано около 2 млн документов, и показатели эти постоянно растут. Основным достоинством системы Яndex является способность находить заданные слова независимо от формы, в которой они употребляются в документах. Интересно, что система способна "склонять" или "спрягать" даже те слова, которых нет в словаре, причем поиск может вестись как по всем формам ключевых слов, так и по конкретно заданной. Данная поисковая система позволяет устанавливать расстояние между фрагментами ключевой фразы с учетом их порядка, усиливать значимость того или иного слова, использовать уточняющие слова. Поиск можно также вести по заголовкам документов, по встречающимся на страницах ссылкам. Кроме того, в Яndex легко найти документы, похожие по смыслу на те, что заинтересовали вас по предыдущему запросу. Можно ограничивать поиск уже в найденных документах, т. е. производить своеобразную "чистку" результатов запроса. При упорядочивании списка ссылок, получаемого пользователем, учитывается число встретившихся в документе ключевых слов, их положение и расстояние между ними. кроме того, каждый из адресов URL содержит краткую аннотацию найденного документа.
Каталог русскоязычных ресурсов "Ау!" по принципу построения напоминает американский Yahoo!, но включает в себя гораздо меньшее количество ссылок. Директория "Ау!" была создана благодаря разработкам компаний V6 и "Агама", оборудованию фирмы Intel, данным Центрального экономико-математического института и усилиям Российского (регионального) общественного центра Internet-технологий. Система содержит сведения о том, сколько сайтов в ней зарегистрировано и сколько из них на данный момент реально работает. Неоценимую услугу пользователю окажет также оценка доступности сервера по десятибалльной шкале: она позволяет планировать время, связанное с ожиданием загрузки той или иной страницы. Любопытно, что у сервера "Ау!" есть собственная база данных (что, кстати, отличает ее от Yahoo!), поэтому ссылки, полученные от "Ау!", можно сортировать не только в алфавитном порядке, но и по тому параметру, по которому вы считаете нужным. В том случае, если на ваш запрос данная система не может предоставить список адресов из собственной базы, она предложит параллельный поиск на серверах "Яndex" и "Апорт!". Еще одна интересная особенность "Ау!": в отличие от многих других каталогов, ссылки на внешние ресурсы в этой директории открываются в новых окнах.
Этот каталог принадлежит компании Demos. Для удобства пользователей директория существует как в англоязычном, так и в русскоязычном вариантах. И хотя подбор тематических рубрик здесь довольно стандартен, но хорошенько исследовав их, можно найти множество ссылок на интересные сайты.
На сегодняшний день данная система находится в процессе генеральной реконструкции. List.ru можно назвать одним из самых масштабных проектов русскоязычной части Internet. Если "Ау!" можно было бы сравнить с Yahoo!, то List.ru больше напоминает The Mining Company, поскольку в последнее время активно занимается набором гидов для своих тематических разделов.
http://www.diamondteam.ru/catalog/
Этот проект является единственным русскоязычным каталогом в Сети, который, кроме онлайнового, имеет еще и офлайновое воплощение в виде CD-ROM. На данный момент ресурс содержит более трех тысяч качественных ссылок на русскоязычные сайты и является одним из самых авторитетных в РуНет.
В отличие от своего легендарного тезки, "Иван Сусанин" не заставит вас долго плутать по "закоулкам" Сети. На сегодняшний день система содержит ссылки на более чем одиннадцать тысяч русскоязычных ресурсов. Радует глаз и довольно стильный дизайн сервера.
Этот проект также представляет собой коллекцию тематических ссылок, число которых сегодня превышает 8,5 тысяч. Интересно, например, что наибольшее количество ссылок мы обнаружили в разделе "Медицина".
На данном сайте представлено более 2000 адресов онлайновых журналов, газет и других периодических Internet-изданий. Всех, кто пристально следит за последними событиями в науке, культуре, бизнесе, экономике и политике, этот сервер непременно заинтересует.
Довольно часто пользователь знает, что конкретно ему нужно найти. Есть ли смысл при этом обращаться к большим поисковым системам? Несмотря на то что в результате мы получаем множество разнообразных ссылок, нужную среди них отыскать будет непросто. Специализированные же поисковые системы индексируют лишь сайты, которые содержат информацию по какой-то определенной теме.
Если вы интересуетесь историей древних цивилизаций, то вам просто необходимо воспользоваться услугами этой поисковой системы, разработанной в университете Эвансвилла (США). Как правило, 98% ссылок, выданных в результате запроса, будут релевантными.
Людей, которые всерьез занимаются проблемами оккультизма и мистики, наверняка заинтересует этот сайт. Ссылки на страницы, авторы которых особо преуспели в освещении данной тематики, получают специальный знак отличия от создателей поисковика.
Долгое время в среде поисковых систем царило засилье ресурсов, принадлежащих американским компаниям. И вот в 1996 г. фирма EuroSeek решила создать поисковик, который будет собирать данные только с европейских сайтов. На сегодняшний день EuroSeek может "читать" информацию на 40 языках мира, в том числе на украинском и русском.
Педагоги, преподаватели, доценты, методисты, равно как и многие другие люди, несомненно, заинтересуются калифорнийским проектом цифровой библиотеки InfoMine. Судите сами: система индексирует более 14 тыс. ресурсов по теме образования, из которых около 4 тыс. сайтов касаются вопросов медицины и биохимии, свыше 3 тыс. -- политики и экономики, 800 -- проблем образования детей и молодежи.
Эта система предоставляет своим пользователям возможность поиска почтовых рассылок, групп новостей и чатов по самым разнообразным темам. Приятной особенностью Liszt является возможность дополнения базы данных своими ресурсами.
http://www.maths.usyd.edu.au:8000/MathSearch.html
Данная поисковая система будет полезна всем, кто интересуется вопросами математики и статистики. Возможности поиска здесь довольно обширны -- можно задавать несколько ключевых фраз, четко определяющих тему, информацию по которой вы хотите получить.
Scour.net является одним из самых авторитетных серверов, когда речь идет о поиске мультимедиа. С его помощью можно легко отыскать множество интересных файлов, содержащих графику, анимацию, видео- или аудиоданные. Директория Scour.net позволяет совершать поиск среди миллиона регулярно индексируемых Web-страниц.
Проект StudyWeb -- это еще одна попытка классифицировать ресурсы Сети, имеющие отношение к образованию. База данных и поисковый механизм StudyWeb подобны тому, что использует сервер The Mining Company (который, кстати, сегодня называется About.com), где за определенные разделы сайта отвечает гид, занимающийся подбором ссылок и их обзором.
http://www.whowhere.lycos.com/
Все подобные проекты имеют одинаковую основу -- телефонные справочники США, из которых и создается первоначальная база данных. Для тех, кто не зарегистрирован в WhoWhere, мы рекомендуем сделать это, так как указанная система давно стала стандартом де-факто при поиске людей во всем мире.
Эта система предоставляет неплохую коллекцию ссылок на различные ресурсы Сети, посвященные искусству. Все они сгруппированы по трем основным категориям -- носитель (холст, литография, файл и т. д.), стиль (абстракционизм, импрессионизм, анимация и т. д.) и страна.
Сервер Yack! содержит самую большую в Internet базу данных с информацией о различных чатах, причем его специализацией являются так называемые планируемые чаты -- online-беседы со знаменитостями или посвященные какому-либо событию. По утверждению разработчиков, база данных содержит информацию о новейших чатах и обновляется чуть ли не ежеминутно. Она включает исчерпывающие сведения о планируемом чате: URL, дату, время, продолжительность, плату за участие и программное обеспечение, необходимое для успешного участия в онлайновой беседе.
Сайты MP 3 Site и 2Look4 предназначены для поиска музыки, записанной в файлах *.mp3. Это далеко не единственные серверы такого рода. Оба этих сайта весьма похожи. На MP 3 Site происходит примерно 50 тыс. обращений в день, а 2Look4 славится надежностью и работоспособностью всех ссылок, проверяемых один раз в полчаса.
Одним из самых известных порталов в Сети был, есть и остается сайт компании Yahoo. Каталог содержит ссылки, которые наиболее полно отвечают указанной вами тематике, в Yahoo! никогда не зарегистрируют сайт, который находится в стадии разработки, в поле зрения создателей этой замечательной поисковой системы не попадут серверы, чьи хозяева стараются заманить к себе клиентов с помощью рекламных призывов, совершенно далеких по содержанию от истинного информационного наполнения страниц. В компании Yahoo не разглашают информации о том, сколько всего сайтов зарегистрировано на ее сервере, но на собственном опыте убеждаешься, что это -- масштабный и постоянно развивающийся проект. Сервер Yahoo! имеет примерно 40 млн посетителей в месяц, и это число непрерывно растет. Кроме того, много почитателей и у раздела Yahoo! Headlines, где собраны новости от ведущих информационных агентств: Reuters, AP, MSNBC и др. Есть и более 50 разделов, касающихся самых разных областей, -- Yahoo! Finance для бизнесменов и финансистов, Yahoo! Travel для путешественников, Yahooligans! for Kids для несовершеннолетних и множество других. Посетители сайта могут получить бесплатно адрес электронной почты, воспользоваться возможностями сетевого пейджинга (Instant Messaging), принять участие в on-line дискуссиях (Chat) и, что особенно ценится клиентами, создать индивидуальный портал (My Yahoo!). Сайт имеет 14 локализованных версий, где расположена информация, касающаяся только конкретного региона, к примеру Yahoo! Germany или Yahoo! Asia.
На сегодняшний день база данных AltaVista является самой крупной в Internet и насчитывает более 140 млн страниц. Регистрация сайтов в ней происходит в течение 48 ч, и если другие поисковые машины иногда отключаются на технический перерыв, отказываются принимать адреса или включают их в базу данных с большим опозданием, то за AltaVista таких "грехов" не замечалось. Среди особенностей этой поисковой системы можно указать такие дополнительные механизмы, как Photo Finder -- инструмент поиска изображений, технологию онлайнового перевода документов, разработанную компанией Babelfish. Кстати, последнее свойство позволило поисковой машине индексировать документы на нескольких языках, список которых вы найдете на ее заглавной странице. Совсем недавно AltaVista объявила о сотрудничестве с компанией AskJeeves (http://www.askjeeves.com/), которая занимается занесением информации с Web-страниц в базу данных, управляемую с помощью команд на английском или любом другом языке. Таким образом, зайдя на сайт AskJeeves либо на заглавную страницу AltaVista и набрав вопрос на английском языке, вы можете получить на него исчерпывающий ответ.
Поисковая машина Excite еще до недавних пор принадлежала одноименной корпорации. Но на данный момент портал является собственностью @Home -- дочерней компании AT&T. История возникновения Excite довольно стандартна для Силиконовой Долины. На сегодняшний день портал Excite является одним из самых крупных в Сети и серьезно конкурирует с Yahoo!. База данных поисковой машины Excite постоянно пополняется и содержит около 50 млн страниц. Что же отличает Excite от других подобных серверов? В ее алгоритме поиска с самого начала заложена технология ICE (Intelligent Concept Extraction), которая позволяет работать не только с отдельными ключевыми словами, но и с понятиями, объединяющими их. Так, если вы ввели ключевую фразу "уход за волосами", то поисковая машина просмотрит также страницы, содержащие слова "шампунь", "перхоть" и т. д. А вот с отдельными ключевыми словами система работает несколько хуже. Технология Excite лицензирована компанией Netscape Communications для использования на портале NetCenter, а также корпорацией America Online, причем в последнем случае с правом дополнения базы данных, а значит, результаты поиска в Excite и AOL NetFind могут несколько отличаться.
Решение об основании портала и поисковой машины Lycos многими специалистами было встречено без энтузиазма, они сомневались, что этой системе удастся создать достойную конкуренцию таким гигантам, как AltaVista, Excite или Yahoo!. Но на сегодняшний день Lycos является прекрасным инструментом поиска, особенно в сфере Internet-торговли. На сайте есть руководства для покупателей в США (от автомобилей до квартир, а также по выбору города, где жить дешевле и лучше). База данных системы регулярно пополняется, хотя сам механизм поиска за последние несколько лет существенных изменений не претерпел. Партнеры и рекламодатели Lycos работают в самых разнообразных областях бизнеса и предлагают широкий спектр услуг, так что выбирать есть из чего. Портал выделяется из ряда других наличием известнейшего каталога WhoWhere с персональной информацией о пользователях Internet, а также (благодаря приобретению компании Tripod) развитыми средствами по предоставлению услуг электронной почты (имеется возможность создавать подпапки для хранения корреспонденции и адресные книги) и размещению бесплатных мини-сайтов. С помощью Personal Lycos можно создать персональный календарь, дневник, список напоминаний и менеджер контактов.
Поисковая машина InfoSeek с самого начала своего создания входила в десятку наиболее часто используемых в Сети. В свое время она славилась возможностью индексировать все страницы из своей базы данных в течение одного дня. Сегодня InfoSeek активно занимается электронной коммерцией, иногда чрезмерно перегружая страницы рекламными объявлениями. На сайтах есть возможность бесплатного получения места для публикации собственных страниц (Home Page Center), пейджинга и ведения дискуссий в on-line. Также предлагаются дополнительные услуги, такие как ESP (Extra Search Precision) -- для точного поиска информации в Web, а также апплет Infoseek Desktop, позволяющий производить поиск в Internet прямо на рабочем столе. Есть и несколько локализованных версий InfoSeek, но русский, увы, в список поддерживаемых языков не входит.
Если вы зайдете на заглавную страницу WebCrawler, то обнаружите логотип Excite, поскольку данная поисковая машина является составной частью Excite Network. Ее создатели обращают внимание на то, что многие более поздние технологии, включая Lycos и InfoSeek, были разработаны уже после появления WebCrawler. База данных проекта продолжает регулярно пополняться, использовать эту систему рекомендуется в случаях, когда нужен поиск по одному или двум ключевым словам.
Говорим HotBot -- подразумеваем Wired Digital, говорим Wired Digital -- подразумеваем HotBot... По крайней мере, так было до недавнего времени, но в конце 1998 г. компания Lycos сообщила, что ее очередным приобретением станет именно Wired Digital. Таким образом, поисковая машина HotBot оказалась подчиненной руководству Lycos. Однако не следует думать, что HotBot стал просто приложением к поисковой системе Lycos, он по-прежнему продолжает функционировать самостоятельно, не уступая, а во многих случаях даже превосходя своего нового хозяина. По утверждению HotBot, посетители данного поискового сервера -- в основном компьютерщики-профессионалы. В нем можно совершать полноценный текстовый поиск по произвольному ключевому слову. Его советуют использовать для поиска необходимого программного обеспечения и данных, связанных с информационными технологиями. Однако компьютерной тематикой данная поисковая система, безусловно, не ограничивается. Более того, постоянно ведется работа, направленная на дальнейшее ее развитие: пополняется база данных Inktomi, выпускаются новые версии алгоритмов.
История возникновения этого портала довольно тривиальна: разработчикам захотелось создать систему, которая одновременно выполняла бы функции качественной поисковой машины и директории, регулярно пополняемой новыми полезными ссылками. Директория ссылок, которая редактируется вручную, подкрепляется мощью поисковой машины AltaVista, что создает один из самых информативных порталов. В последнее время в отношениях между LookSmart и AltaVista наблюдается, я бы сказал, обратный процесс: последняя начала пользоваться директорией LookSmart для укрепления своих позиций как Internet-портала, так что в скором будущем, возможно, эти компании сольются. Пока же LookSmart будет полезной многим пользователям: гигантская база данных AltaVista поможет отыскать нужный сайт по ключевым словам, а рубрики LookSmart -- поточнее определиться с предметом поиска.
это -- один из многих сайтов, который, хоть и довольно хорошо известен в англоязычной Internet, но не пользуется широкой популярностью. WhatUSeek был представлен миру в ноябре 1996 г. данная поисковая машина имеет лишь небольшую группу поклонников и конкурировать с более мощными системами не в состоянии. Создатели сервера пытаются привлечь к себе посетителей единственным приемом -- довольно забавным интерфейсом поиска с обилием графики.
Данная разработка студентов Стэнфордского университета в последнее время становится одним из самых интересных проектов метапоисковых систем в Сети. Авторы небезосновательно посчитали, что популярность и "авторитетность" той или иной страницы определяются количеством упоминаний ее адреса в других источниках, поэтому и решили вести учет внешних ссылок на ресурс. В метапоисковой машине Google! рейтинг страницы определяется как по количеству ссылок на нее с популярных внешних сайтов, так и по упоминанию данного адреса в авторитетных источниках информации.
Спайдер компании практически ежедневно индексирует 5400 адресов Internet, в их число входят электронные издания и периодика, службы новостей, академические библиотеки и архивы электронных текстов. Еще одной особенностью Northern Light является возможность сортирования полученной информации по адресам сайтов и темам Желающие могут подписаться на всевозможные тематические подборки, например материалы определенных рубрик из любимых газет, журналов и т. д., а затем в течение года получать специально подготовленную информацию.