Учебная работа. Реферат: Сетевые средства поиска информации

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Контрольные рефераты

Учебная работа. Реферат: Сетевые средства поиска информации

Сборники

Размер инфы веб переживает быстрый рост: по оценкам профессионалов, количество Web-страниц возросло от нескольких 10-ов тыщ в 1996 г. до нескольких сотен тыщ к концу 1998 г. В этих критериях ни одно раздельно взятое средство поиска инфы не сумеет охватить всех ресурсов Сети. Потому для действенного решения задачки поиска юзеру нужно свободно ориентироваться в сложном и разнообразном мире поисковых инструментов. Верный выбор средства поиска инфы в любом определенном случае является значимым, если не определяющим, фактором удачного выполнения задачки.

Сборники представляют собой систематизированные группы адресов, объединенные, как правило, по теме. К удобству их внедрения можно отнести то, что, если юзеру известна тема искомого документа, он будет изучить подобающую ветвь каталога, не отвлекаясь на посторонние, не относящиеся к делу документы. Но, размер каталога ограничен физическими способностями редакторской группы и ее субъективностью в выборе материала. В их отсутствует информация на узенькие, особые темы, ну и саму тему искомого документа не постоянно можно сконструировать в границах систематизации каталога.

Заглавие

Описание

Яху!

Самый пользующийся популярностью каталог, содержащий необъятную информацию о 10-ках тыщ Web-узлов. 1-ый уровень иерархии содержит 14 направленных на определенную тематику категорий, которые разветвляются еще на 4 — 5 подуровней. Имеет свою машинку поиска, позволяющую: 1) находить по базе Яху!, по Usenet либо по адресам электрической почты; 2) ограничить поиск материалами, размещенными за крайний денек, недельку, месяц, год либо 3 года; 3) выдать статьи, содержащие хотя бы одно ключевое слово либо все главные слова; 4) находить по однокоренным словам либо лишь по обозначенным главным; 5) выдать результаты по 10, 25, 50 либо 100 на одной страничке.

Excite Reviews

Содержит обзоры 60 тыс. узлов веб, систематизированные в иерархический каталог.

City.Net

Каталог сведений о различных странах и городках.

Galaxy

Иерархический каталог с подробным описанием направленных на определенную тематику категорий на первой страничке. Производит поиск по группы поиска, по одному либо нескольким главным словам, лаконичный и подробный вывод поисковых результатов, переход на странички Gopher и Telnet.

Yellow Pages

Поиск инфы о 16 млн. американских компаниях в разных областях деятель, также индивидуальные данные и электрические адреса личных лиц.

Поисковые машинки

В разделе курса «Поиск инфы в веб» мы разглядели механизм работы поисковых систем: часть машинки, именуемая «пауком» (либо «спайдером»), повсевременно путешествует по узлам сети, собирая и обновляя информацию, шифрует ее (индексация) и записывает в специализированную базу данных. При поступлении от юзера запроса в виде набора главных слов машинка изучит свою базу данных и выдает перечень документов, содержащих главные слова, обычно, ранжированный зависимо от частоты вхождения главных слов и остальных черт.

К плюсам внедрения поисковых систем можно отнести большой размер инфы, исследуемой ими, и ее повторяющуюся актуализацию. Но, при всем этом не учитываются документы, не содержащие главных слов, а, с иной стороны, в перечне содержится много шумовой, не относящейся к делу инфы, отсеивание которой занимает большое время.

Заглавие

Описание

Lycos

Обхватывает 68 млн. страничек. Можно избрать характеристики поиска: одно, несколько главных слов либо фраза; усечение определений; ограничения на число совпадений; степень соответствия поисковых результатов главным словам; форму вывода результатов ( короткую либо подробную ); количество отысканных определений на каждой страничке. Низкие быстродействие и оперативность обновления инфы.

Alta Vista

Обхватывает наиболее 30 млн. страничек на 225000 серверах, обеспечивает доступ к 3 млн. статей в 14000 телеконференциях Usenet. Имеет два режима: Simple query и Advanced query. В режиме Simple можно вводить шаблоны для поиска не наименее, чем с 3-мя обозначенными знаками сначала слова. Если слово содержит хотя бы одну большую буковку, ведется поиск с учетом регистра. Ниже строчки ввода выдаются советы по поиску. В режиме Advanced можно создавать сложные запросы, основанные на логических операторах AND, OR, NOT, NEAR и указывать аспекты сортировки приобретенных результатов. Можно указывать спектр дат опубликования. Предоставляет возможность поиска изображений. Удачный интерфейс. Высочайшее быстродействие, многовариантное поисковое предписание, возможность поиска на российском языке с учетом морфологии. Система не упорядочивает поисковые результаты, потому ее целенаправлено использовать для специфичного либо исчерпающего поиска.

Infoseek Guide

Обхватывает 1,5 млн. страничек. язык запросов дозволяет применять все вероятные варианты логических выражений. Наименее полные, чем на остальных серверах, поисковые результаты, неловкий интерфейс.

Infoseek Ultra

50 млн. страничек WWW, вероятен поиск на российском языке, поиск изображений.

WebCrawler

Обхватывает WWW, Usenet, Gopher, FTP, Telnet. Вероятен поиск на российском языке. Простота в воззвании, быстрота. Наименее широкая база узлов, чем на остальных серверах.

HotBot

Обхватывает 54 млн. страничек. Многовариантное поисковое предписание. Вероятен поиск на российском языке.

Мета-средства поиска

Мета-средства поиска разрешают усовершенствовать процесс методом пуска сразу нескольких средств поиска. Этот метод существенно увеличивает свойство поиска, объединяя плюсы и способности всех применяемых средств.

Но, время от времени поиск с применением мета-средств может оказаться весьма неспешным, потому что им приходиться координировать во времени поступления результатов обработки запроса от нескольких серверов и препядствия, возникшие у 1-го из их, могут остановить работу всей системы. Еще одним недочетом мета-средств будет то, что они не разрешают применять способности языка запроса всякого из используемых поисковых средств и не дают способности заглянуть в их справочные управления.

Заглавие

Описание

MetaCrawler

Подключает 9 поисковых машин сразу. Проверяется возможность доступа к отысканной инфы, соответствие содержимого данному аспекту. Можно сортировать информацию по территориальной близости, по близости к определенному узлу, по отношению к компании и т.д. Вероятен поиск на российском языке. Есть возможность индивидуальной опции интерфейса.

SavvySearch

Запускает одну из 4 групп, состоящих из 3-х поисковых машин:

WebCrawler, Яху!, Lycos

Galaxy, Excite, DejaNews

FTPSearch95, Yellow Pages, Infoseek

Magellan, NlightN, PointSearch

Поисковое предписание с внедрением операторов AND и OR. Вероятен поиск на почти всех языках, в том числе на российском.

All-in-One

Отлично структурированная мета-машинка, имеющая древовидную классификационную структуру, на верхнем уровне которой расположены группы: , весь Internet, личные интересы, ПО , страницы личных лиц, анонсы и погода, литература и прочее. Уточняя содержание каждой группы, можно попасть на последующий уровень.

Употребляет около 200 поисковых средств.

Internet Sleuth

Обхватывает 1500 баз данных. Можно запустить сразу до 10 поисковых машин из 24, имеющихся в меню. Употребляет операторы AND, OR, NOT, усечение определений. Для каждой поисковой машинки можно задать собственный аспект и свое ограничение времени поиска.

Вероятен поиск на российском языке. Направленный на определенную тематику поиск ведется по большенному количеству повторяющихся изданий и информационных служб почти всех государств. Для группы «НОВОСТИ» употребляется 39 источников.

Русские средства поиска

Сборники

Заглавие

Описание

ПАУК

Широкий охват русского WWW. Глубина поиска: заглавие, 1-ые строчки, электрический адресок документов. Поддерживает все российские шифровки, возможность усечения определений. большенный размер, разветвленная иерархическая структура. Слабенькая оперативность обновления инфы.

Созвездие веб

Обхватывает около 400 серверов. Возможность усечения определений. Содержит наименования и короткие свойства серверов. Симпатичная графика. Маленькая зона поиска, слабенькая иерархия.

Желтоватые странички веб

Около 1200 Web-серверов. Большенный размер инфы, отлично обмысленная структура.

Russia on the Net

1-ый каталог российских ресурсов.

АУ!

Юный, быстроразвивающийся каталог.

Сокровища Веб

Каталог Web-ресурсов на сервере Relcom.

Поисковые машинки

Заглавие

1. Зона поиска

2. Глубина поиска

3. язык запроса

4. Вывод результата

5. Плюсы и недочеты

Rambler

1. Около 4000 Web-узлов, недельный архив телеконференций Relcom.

2. Все слова в документе.

3. Операторы AND, OR, NOT. Возможность усечения определений. Ограничения по дате. Обычный запрос — 30 ссылок, углубленный — 1000.

4. Заглавие документа, резюме, размер файла, адресок, дата крайнего обновления, степень соответствия, шифровка.

5. Удачный интерфейс, высочайшее быстродействие, полная информация на выходе. Слабенькая оперативность обновления инфы.

Aport!

1. 16 серверов.

2. Все слова в документе.

3. AND и OR. Поиск по фразе (в двойных кавычках). Возможность усечения определений. чувствительность к строчным и строчным буковкам.

4. Заглавие документа, резюме, размер файла, адресок, дата крайнего обновления, степень соответствия запросу, шифровка.

5. Удобство для юзера, высочайшее быстродействие.

Российская машинка Поиска

1. Наиболее 900 русских узлов.

2. Все слова в документе.

3. AND и OR. Поиск по отдельной фразе. Ограничения поиска определенными элементами Web-страниц (заглавие, главные слова, создатель и т.д.). юзер может установить либо отменить чувствительность к строчным и строчным буковкам и указать количество вероятных ошибок в разыскиваемом слове, если нет убежденности в его написании.

4. Заглавие документа, резюме, адресок, степень соответствия запросу.

5. Многовариантность поискового предписания. Непривычная форма выдачи результата.

Яndex-Web

1. 5000 серверов — вся российская часть Веб, включая домены «RU», «SU», также русские ресурсы в остальных доменах.

2. Все слова в документе.

3. AND, OR, NOT. Дозволяет производить поиск снутри абзаца, документа, в заголовках и остальных полях, также с указанием расстояния меж словами. Поиск по фразе. Учет морфологии российского языка. чувствительность к строчным и строчным буковкам. Возможность обычного и сложного запроса. Поиск в отысканном.

4. Заголовок, начало текста документа, размер файла, дата и адресок, степень соответствия запросу, шифровка. Возможность «подсвечивания» слов в тексте, соответственных поисковому предписанию.

5. индексация обеспечивает нормализацию слов и неповторимость документа. Широкий охват, удачный интерфейс, высочайшее быстродействие, высочайшая оперативность обновления инфы (раз в недельку).

Данное описание не претендует на исчерпающий охват средств поиска. Наиболее подробную информацию можно получить, изучая другие варианты списков поисковых средств, доступные в веб.

]]>