Учебная работа. Курсовая работа: Сравнительный обзор современных поисковых систем

(Пока оценок нет)

Загрузка...

Учебная работа. Курсовая работа: Сравнительный обзор современных поисковых систем

Учреждение образования

«Брестский муниципальный Институт имени А.С.Пушкина»

математический факультет

кафедра информатики и прикладной арифметики

Курсовая работа

Сравнительный обзор
современных поисковых машин

Брест, 2008

Содержание

Введение. — 2 -

Поисковые системы.. — 2 -

Самые пользующиеся популярностью поисковые машины.. — 3 -

Сравнительный обзор и систематизация поисковых системы.. — 5 -

Более калоритные представители. — 9 -

Достоинства и недочеты поисковых машин.. — 16 -

Сравнительный анализ работы разных поисковых машин: — 18 -

Модель «безупречной» поисковой системы.. — 19 -

Советы по применению поисковых машин: — 21 -

Заключение. — 23 -

Применяемые источники: — 25 -

Введение

1-ые поисковые системы возникли в сети Веб наиболее 10 лет вспять. Тогда они делали только одну функцию – поиска ссылок к не так давно сделанным страничкам.

На исходном шаге развития веба, число юзеров сети было невелико и количество инфы относительно маленьким. В подавляющем большинстве случаев юзерами веб были сотрудники разных институтов либо научных организаций. В то время поиск подходящей инфы в сети был не настолько животрепещущ, как сейчас. Сейчас же поисковые системы перевоплотился в функциональный сервис. Они разрешают юзерам отыскивать в сети веб самую различную информацию, по этому пользуются большим фуррором.

Поисковые системы

Одной из первых попыток организации доступа к информационным ресурсам сети сделалось создание направленных на определенную тематику каталогов веб-сайтов. Первым, открывшимся в апреле 1994 г, стал Яху. Это еще не было поисковой машиной, в современном осознании, т.к. возможность поиска инфы ограничивалась ресурсами, зарегистрированными в каталоге Яху. Сборники ссылок ранее использовались достаточно обширно, но в истинное время фактически утратили свою популярность. Разъяснение этому весьма обычное – даже современные, содержащие большущее количество ресурсов сборники, представляют информацию только о достаточно незначимой части сети. Для сопоставления — самый полный каталог сети веб — DMOZ содержит информацию приблизительно о 12.000.000 ресурсов, в то время как база данных самой полной поисковой системы Гугл состоит наиболее чем из 28.000.000.000 документов.

Первой настоящей поисковой машиной в 1994г. стал проект WebCrawler. Дальше в 1995 году возникли поисковые системы AltaVista и Lycos. В 1997 году в Стэнфордском институте, в рамках исследовательского проекта, была сотворена Гугл — самая пользующаяся популярностью поисковая машина на данный момент в мире. В 1997 году возникла поисковая машина — Yandex, фаворит в русской части Веба. На данный момент главными поисковыми машинами являются три интернациональных – Гугл, Яху и MSN Search. Другие, коих не не достаточно, употребляют полностью либо отчасти базы и (либо) методы выше приведенных систем. В Руинтернете главный поисковой машиной является Yandex, дальше по популярности идут Rambler, Гугл.ru, Mail.ru и Aport.

Поисковая машина — это сумма последующих компонент:

Web server (Интернет-сервер) – сервер поисковой машинки, который производит взаимодействие меж юзером и остальными компонентами системы.

Spider (паук)- программка написанная по принципу браузера, создана для скачки Интернет-страниц. Браузер предназначен для зрительного использования страничек, а паук работает с html кодом впрямую. Чтоб поглядеть «сырой» исходник нажмите в меню браузера: Вид- Просмотр html кода.

Crawler («путешествующий» паук) – программка, которая автоматом уходит по всем наружным ссылкам странички. Ее задачка — поиск не узнаваемых (либо модифицированных) документов и в расстановке ценностей, куда далее должен идти Spider.

Indexer (индексатор) — программка—анализатор скаченных пауками веб-страниц. Она «разбирает» на части скачанную страничку и анализирует ее элементы, такие как текст, служебные html-теги, заглавия, индивидуальности стилистики и структурные формы.

Database (база данных) – хранилище для скачанных и обработанных страничек — общая база данных поисковой машинки.

Search engine results engine (система выдачи результатов) – извлекает поисковые результаты из базы данных поисковой системы. Конкретно она решает, какие странички наиболее соответствуют запросу юзера и отсортировывает их в подходящем порядке. Модуль работает согласно данным поисковой машиной методам ранжирования.

Самые пользующиеся популярностью поисковые системы

Толика каждой поисковой машине в Руинтернете

Русские

Англоязычные

Яndex

Гугл

MSN search

Rambler

Яху

Аport

Aol

MSN Search

Lucos

Яху

Cuil

AltaVista

Ask Jeeves

Mail.ru

LookSmart

анализ трафика – июнь 2008г.

Рейтинг поисковых машин в Рф

количество переходов с поисковых машин

Сравнительный обзор и систематизация поисковых системы

Общее соотношение поисковых машин в английских странах

Таблица 1

Гугл

Яndex

Rambler

1997г.

Служба базирована на работе crawler’ов, обхватывающей всю сеть. Приоритетное пространство занимает релевантность результатов и их соответствие запросу. В отличие от почти всех поисковиков, боты Гугл индексируют все странички, а не только лишь самые главные. Есть меню, где с легкостью можете отыскивать в Сети изображения, обсуждения, проходящие в группах новостей, читать анонсы либо проводить поиск продуктов. Можно получить доступ к инфы из Open Directory (Открытого Каталога, DMOZ).
Система длительно хранит проиндексированные роботами странички в собственном кэше, что дозволяет «воскрешать» мертвые, удаленные с серверов странички, либо созидать старенькые версии лишь что освеженных страничек. Система предоставляет хорошую проверку правописания, легкий доступ к словарным определениям, просмотр биржевых ставок, дорожные атласы, базы номеров телефонов и почти все другое. программка AdWords располагает маркетинговые объявления на веб-сайтах Гугл и его партнеров. Также Гугл является бесплатным поставщиком результатов запросов в поисковике неких остальных поисковых машин.

1997г.

В системе делается поиск с учетом морфологии российского языка, поиск с учетом расстояния, и кропотливо разработанный метод оценки релевантности.

Реализован естественно-языковой запрос: сейчас поисковик можно спрашивать «по-русски», задавая длинноватые вопросцы. к примеру: «где приобрести холодильник».

Поисковый бот дозволяет предоставить способности поиска по различным зонам текста, ограничение поиска на группу веб-сайтов, поиск по ссылкам и изображениям. Существует «индекс цитирования» — количество веб-сайтов, ссылающихся на данный ресурс. Работает фильтрация поисковых результатов от мата и порнухи.

Службы: почта, анонсы, открытки и закладки, автоматическое объединение новостей в сюжеты и выделение основных тем денька. Плюс, стилизованный под Гугл Toolbar, спартанский поисковик ya.ru. Поиск сейчас ведется не только лишь по Интернет-страницам, да и по спец массивам данных – новостям и товарам. Находит документы не только лишь в формате html.

1996г.

Система работает с большенный скоростью поиска, обновление поискового индекса происходит несколько раз в денек. Поисковик постоянно находит самые свежайшие документы и крайние анонсы. Rambler знаком с русским языком, соображает определения типа «б/у», «у.е.» и «а/я». услуги: строчка поиска, почта и анонсы. Изюминка — механизм ассоциаций. Кроме обычной ответной странички, в какой отысканные документы размещены в порядке убывания релевантности, возникает строчка — «У нас также отыскивают». В ней приведены слова и словосочетания тематически связанные с запросом. Новейший механизм также исправляет ошибки запросов. На введенное gjujlf юзер получит сейчас хороший результат: сведения о погоде (gjujlf – это слово «погода» набранное латиницей). Rambler Mass Media — 1-ый и как и раньше фаворитный на рынке информационный дайджест. Кроме текстовых материалов и фоторепортажей, ставших визитной карточкой проекта, Rambler Mass Media представляет юзерам аудио и видеосюжеты.

Aport

MSN
Search

Яху
!

1996г.

Продолжает работать под управлением OC Windows. К принципиальным свойствам первой версии поисковой системы Aport можно отнести перевод запроса и ответа на британский язык и назад. 2-ое свойство – реконструкция проиндексированных страничек из своей базы. Это дает возможность просмотра уже несуществующих страничек.

Система построена на базе выдачи результатов по раздельно взятым веб-сайтам. Для разделения ресурсов на веб-сайты Aport употребляет информацию, которую предоставляет каталог AtRus, либо обладатели ресурсов.

В поисковой машине Aport в первый раз была реализована возможность поиска по новостным лентам.

1994г.

Ранее у MSN никогда не было собственного паука либо каталога. С 1997 года для выдачи поисковых результатов использовались различные базы данных. Лишь с начала 2005 года MSN запустил бета-версию собственного поискового метода.

Система МSN в особенности принципиальна, т.к. конкретно этот поисковик по дефлоту употребляется, когда юзеры Internet Explorer’а вводят в адресную строчку поисковый запрос.

Локализована приблизительно для 30 государств, таковых как: Англия, Дания, Бельгия, Новенькая Зеландия, Япония и др. Также эта система предоставляет юзерам возможность сортировать поисковые результаты: по дате, по алфавиту, по релевантности.

1995г.

На нынешний денек это самый старенькый и более полный каталог Веб-ресурсов. Система зародилась как обычная коллекция закладок, которую пополняли всего 2 человека — Дэвид Фило и Джерри Янг. Вприбавок к релевантной выдаче результатов запросов в поисковике Яху дает возможность применять ярлычки над поисковой формой на собственной главной страничке для поиска изображений, продуктов либо перехода на Желтоватые Странички Яху. Можно создавать поиск по каталогу Яху. Есть панель для браузера Firefox. Для

хранения почты система дает 1 гб бесплатного места либо 2 по годичному абонементу. Яху реализует пространство на веб-сайте для маркетинговых ссылок; продажа ведется через программку Overture. Система учитывает орфографические ошибки, дозволяет находить слово только по первым буковкам.

AltaVista

Teoma

LookSmart

1995г.

Изюминка этого поисковика заключается в возможность вести поиск по усложненным аспектам отбора.

Обеспечение поддержки огромного количества языков (Китайский, Японский, Корейский). Содержит услуги по индексации огромных размеров инфы и возможность моментального поиска в большущих базах данных.

Есть схема «спонсорских» веб-сайтов. Производит разработку корпоративных поисковых машин внутреннего использования. Лицензирует технологии поиска компаниям, в том числе для использования во внутренних сетях. Она пользуется каталогами Яху, и ярлычки над поисковой строчкой разрешают отыскивать в сети изображения, музыку, видео, также направленные на определенную тематику разделы, заполненные вручную. Если вы желаете получать информацию не наименее надежную чем от Яху, но поставляемую через наиболее обычный интерфейс – AltaVista ваш выбор.

2001г.

Поисковая машина, основанная на работе crawlerов (с англ. пауков» — особых программных ботов, сканирующих веб в поисках инфы, которая потом заносится в базу данных), принадлежащих Ask Jeeves. Большая релевантность поиска, интегрированная система проверки правописания запросов, динамические описания страничек, появляющиеся с плодами поиска. Запросы можно вводить на 10 европейских языках. В баз данных поисковика проиндексированы выше млрд неповторимых страничек. Существует возможность уточнения запроса в направленных на определенную тематику топиках, ссылки на которые выдаются на страничке с плодами поиска. Раздел «Ресурсы», также находящийся на страничке результатов, в свою очередь уникален тем, что перенаправляет юзера на веб-сайты, которые послужили начальным материалом для приведенных в качестве результатов статей.

1995г.

LookSmart – это веб-компания, имеющая собственный интернет-каталог и механизм поиска Wisenut. LookSmart — это, сначала, вручную пополняемый список веб-сайтов. Он получает списки 2-мя способами. Во-1-х, коммерческие веб-сайты платят за пространство в торговых топах, уподобляя LookSmart электрическим Желтоватым Страничкам. Во-2-х, есть добровольцы, которые вносят веб-сайты с некоммерческим содержанием в каталог www.zeal.com, принадлежащий LookSmart. Хотя это и отдельный веб-сайт, списки, находящиеся на нем, употребляются при обработке запросов в поисковике LookSmart. Изюминка LookSmart – это возможность доступа к соткам повторяющихся изданий через один из ярлычков над строчкой поиска. Содержит службу Furl, созданную для архивирования Интернет-страниц и ссылок на их. Для архива страничек юзера предоставляется 5 Гб вольного места. Запустила систему вертикального поиска из 161 веб-сайта.

Scirus

GigaBlast

Aol
Search

2001г.

Спец поисковая машина научной и околонаучной инфы. Scirus употребляет около 200 миллионов страничек научной темы и отфильтровывает результаты ненаучного содержания, которые по релевантности в некий степени соответствуют запросу.

Стартовая страничка Scirus веселит собственной непритязательностью – там лишь Вы и строчка запроса.

Если Вы не весьма сведущи в научных определениях, Scirus помогает ввести корректный запрос для наилучшего поиска.

Это наилучшая из научных специализированных поисковых машин. Она предоставляет информацию определенного направления, помогает в составлении запросов и использовании определений, а не считая того Scirus находит информацию, которая быть может недосягаема в случае использования остальных поисковых систем.

2000г.

Поисковая машина с наиболее чем 2-ух миллиардным количеством индексированных страничек. GigaBlast имеет высшую релевантность запросу и огромное количество разных инструментов поиска. Стартовая страничка GigaBlast.com ординарна и осторожна. В дополнение к обыкновенной строке запроса в наличии имеются каталог, Поиск по блогам, Поиск Путника и Правительственный Поиск.

Система употребляет обыденный прямой поиск —

Соответствие результатов достаточно высоко, не считая того, GigaBlast проводит проверку правописания. Поддерживает запросы в буквальной форме («Почему травка зеленоватая?»). Проводит проверку правописания. В расширенном поиске GigaBlast.com можно находить по четкой фразе, ставить исключение на слово, находить на определенном адресе и т.д. Все стандартно.

В целом GigaBlast является комфортной машинкой поиска с высоко релевантными плодами.

1985г.

большой портал, на котором можно отыскать все, начиная с игр и заканчивая форумами самой различной темы + простота навигации и отлично запоминающееся заглавие обозначающие America Online. AOLbyPHONE – Сервис дозволяет получать заказанную ранее информацию по телефону. AOLSchool – сервис для школьников. DigitalCity – проект виртуального городка. AOL Anywhere – сервис дозволяет получить доступ с хоть какого мобильного устройства к контенту America Online.

AOL Search предоставляет юзерам странички с плодами поиска на основании индекса Гугл, «Интегрированная» версия AOL Search в итоге запросов в поисковике дает ссылки лишь на содержимое, доступное снутри онлайн системы AOL. А пользуясь AOL Search, вы сможете сразу проводить поиск и по Веб, и по Сети AOL. Во «наружной» поисковой машине AOL Search таковой функции нет. Если для вас по нраву Гугл, для вас будет не хватать неких его особенностей в AOL Search, к примеру, кэширования страничек.

Blink TV

Infoseek

Mail
.
ru

2004г.

машинка поиска, позволяющая отыскивать в вебе аудио и видео файлы, используя не только лишь главные слова и фразы, да и фактическое содержание аудио и видеоклипов. Можно заносить поправки в поиск, к примеру, по дате (если ищете материал за определенный период времени) и по релевантности (если желаете получить результаты, более надлежащие тому, что Вы ищете). Есть Smart папки – это папки, содержимое которых автоматом дополняется из веб источников без роли юзера. Они формируются из поисковых результатов по вашему запросу. Внедрение Blinkx TV довольно просто и комфортно (единственное требование – это скоростная связь с Вебом).

1994г.

В данной для нас системе индекс делает бот, но он регистрирует не весь веб-сайт, а лишь обозначенную страничку. Имеется возможность указания главных фраз, представляющих из себя единое целое, прямо до порядка слов. Ранжирование при выдаче осуществляется по числу определений запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти причины употребляются как вложенные процедуры. Infoseek относится к обычным системам с элементом взвешивания определений при поиске, а так же дозволяет проводить то, что именуется контекстным поиском. Это означает, что используя специальную форму запроса, можно востребовать поочередной совместной встречаемости слов, владеет достаточно развитым информационно-поисковым языком (не попросту показывает, какие определения должны встречаться в документах, да и своеобразно взвешивать их).

1997г.

Не является поисковой машиной, это большой портал со обилием сервисов. Но в сервисы mail.ru заходит и поисковая машина. Ведет активную борьбу со мусором и вирусами, сотрудничая по сиим фронтам с создателями «Dr.Web» и «Антивирус Касперского». В 2004 году присоединилась к инициативе почтовых служб мира и начала применять эталон SPF в работе фильтров собственных почтовых серверов. В поисковом механизме существует функция морфологии российского языка и возможность ведения истории запросов в поисковике. Обзавелась 2-мя инноваторскими сервисами: доступом по протоколу IMAP и голосовой почтой — возможностью прослушивания содержимого ящика по сотовому телефону. К порталу Mail.ru добавились такие новейшие сервисы как «Хостинг» и «Энциклопедии».

Lucos

NetScape
Search

Ask Jeeves

1945г.

Система предоставляет доступ к результатам, собранным вручную из LookSmart по результатам более нередких запросов, также из Яху на базе индексов веб-сайтов, составленных роботами. Система Fast Forward дозволяет созидать на одной стороне экрана поисковые результаты, а на иной – 1-ые странички отысканных веб-сайтов. Релевантные запросу группы из каталога, собранного вручную, показываются вверху странички с плодами поиска.

1994г.

Система пользуется индексной базой Гугл, как и главный поисковый веб-сайт AOL – AOL Search. Основное отличие Netscape Search от Гугл в том, что Netscape Search сначала будет создавать поиск по своей базе и выводить эти результаты первыми. Есть разница и в дизайне.

1998г.

Прославилась как поисковая машинка, соображающая «естественную речь» — в поисковую строчку вводится предложение в вопросительной форме, и система правильно отвечает на него. В истинное время Ask Jeeves работает на базе технологии crawlerов, обрабатывая запросы, поступающие в поисковую машину Teoma.

Cuil

Alexa
Internet

HotBot

2007г.

Сотворена выходцами Гугл. Отличительная черта – большенный размер обрабатываемых страничек. Осознает запросы лишь на британском языке.

1996г.

Наикрупнейшая поисковая машина, предоставляющая также Веб статистику о трафике web веб-сайтов.

Сейчас Alexa – это машинка поиска, использующая базы данных 2-ух гигантов мирового веб поиска: Гугл и каталог DMOZ.

1996г.

HotBot предоставляет обычный доступ к трем главным поисковым системам, в базе которых лежит работа crawler’ов: Гугл, MSN и ASK. Не смешивает результаты, приобретенные из 3-х этих источников. Тем не наименее, это резвый и обычный путь к тому, чтоб получить несколько независящих «воззрений» по интересующей вас теме.

Более калоритные представители

Гугл
(
www
.
гугл
.
ru
)

По статистике является самой пользующейся популярностью поисковой машиной в мире.

Основоположники Гугл — аспиранты Стэнфордского института Сергей Брин и Ларри Пейдж. Из умеренной затеи 2-ух энтузиастов она выросла в веб-гиганта, услугами которого раз в день пользуются миллионы человек в 80 странах мира. В одном из интервью Брин, родившийся в Москве, растолковал возникновение Гугл так: «Когда мы начинали, было несколько поисковиков, но свойство их работы оставляло желать наилучшего.

Любой запрос возвращал для вас около тыщи результатов, отсортированных в случайном порядке». Конкретно релевантность результатов, их соответствие запросу, была поставлена во главу угла новейшей системы.

Кроме просто поиска, тут можно ассоциировать цены на продукты в Интернет-магазинах, читать анонсы и почти все другое. Есть и служба блокировки раздражающей веб-рекламы.

Гугл первым применил новейшую технологию поиска и выдачи результатов — релевантность веб-страниц — то, что не лежит на данной определенной страничке, но тем ни наименее влияет на ранг ее выдачи. Поисковая машина Гугл учитывает гипертекстовую структуру Веба, и какие странички на какие ссылаются. Гугл сама описывает релевантность интернет-страниц Страничка, на которую ссылаются почаще, наиболее релевантна и означает наиболее популярна.

Лидерство Гугл никто не может оспорить. Акции компании за 2005 год выросли практически в два с половиной раза. Поисковый трафик за этот же период вырос приблизительно на 30%.

Коммерческое внедрение Гугл запущен в 2000 году и благодаря собственному программному обеспечению, обеспечивающему красивую релевантность поисковых результатов, также доп сервисам (такому, как поиск новостей, встраиваемый в браузер «Гугл bar» с «гасителем всплывающих окон») стремительно набрал популярность посреди «продвинутых» юзеров, которые употребляли сеть сначала как рабочий инструмент. Эффективную систему «направленной на определенную тематику рекламы» также оценили рекламодатели. Не случаем Washington Post именовала сервис Гугл одним из 10 важных интернет-достижений 2003 года.На данный момент Гугл раз в день обрабатывает наиболее 200 миллионов запросов. В собственной работе в истинное время Гугл применяет наиболее 15 тыщ компов.

Размер проиндексированных страничек наиболее 10 млрд!

Справка: … на нынешний денек, благодаря дистрибьюторским соглашениям с Яху, AOL и Ask Jeeves, Гугл раз в день обрабатывает до 80% всех запросов в поисковике, изготовленных в Вебе.

Для сопоставления. Yandex в настощее время имеет в денек 600 тыщ гостей в денек, количество компов 40 единиц, проиндексировано 15 миллионов страничек.

Гугл — фаворит в перечне самых фаворитных поисковиков. В итоге исследования, проведенного компанией comScore, выяснилось, что Гугл — самая пользующаяся популярностью из поисковых машин в США

Я
ndex (www.Yandex.ru)

Поисковик Yandex возник 23 сентября 1997 г. Разраб, компания CompTek, представила новейшую поисковую машину на выставке Softool. Ранее эта компания занималась созданием информационно-поисковых систем. Одним из ее проектов стала система, обеспечивающая поиск с учетом морфологии российского языка. Она занимала 300кб, грузилась в оперативную память вполне и работала весьма стремительно. На базе данной для нас технологии был сотворен «Библейский компьютерный справочник» (поисковая машина, обеспечивающая работу с Ветхим и Новеньким Заветом).

Главными инновациями поисковой системы www.yandex.ru были: проверка уникальности документа – сиим достигалось исключение копий в разных шифровках. И отличительные характеристики поискового метода Yandex. Поиск с учетом морфологии российского языка, поиск с учетом расстояния, и кропотливо разработанный метод оценки релевантности. несколько месяцев спустя, в поисковой машине www.Yandex.ruбыл реализован естественно-языковой запрос. сейчас поисковик можно спрашивать «по-русски», задавая длинноватые вопросцы. к примеру: «где приобрести холодильник» либо «на генном уровне измененные продукты».

В 1998-99гг. совместно с ростом Руинтернета выросли и услуги поисковой системы Yandex. Повышение количества запросов привело к необходимости оптимизации поискового механизма. Новейший поисковый бот дозволил предоставить способности поиска по различным зонам текста, ограничение поиска на группу веб-сайтов, поиск по ссылкам и изображениям. Также, в первый раз в Руинтернете, было введено понятие «индекс цитирования» — количество веб-сайтов, ссылающихся на данный ресурс. Был открыт «Домашний www.Yandex.ru», фильтрация поисковых результатов от мата и порнухи.

В 2000 году поисковая машина Yandex была преобразована в юридическое лицо. Тогда же начинается активное продвижение поисковика в обычных, оффлайновых СМИ . Брутальная, но действенная маркетинговая кампания принесла свои плоды – слоган «Найдется все», некое время спустя, становится нарицательным. Для завлеченных рекламой юзеров поисковая машина www.yandex.ru открывает новейшие службы – почта, анонсы, открытки и закладки. Плюс, стилизованный под Гугл Toolbar, спартанский поисковик ya.ru. Поиск сейчас ведется не только лишь по Интернет-страницам, да и по спец массивам данных – новостям и товарам.

2003 год — поисковая машина Yandex продолжает развиваться. Yandex научился отыскивать документы не только лишь в формате html. Служба Yandex Анонсы конструктивно преобразилась: юзерам предложен уникальный сервис – автоматическое объединение новостей в сюжеты и выделение основных тем денька.

На нынешний денек www.Yandex.ru- наикрупнейший русский портал: его толика посреди поисковых систем Руинтернета составляет около 45%, в то время как идущий следом Rambler может повытрепываться только 22%. Любой денек наиболее 500 серверов компании отдают 2.7 терабайт трафика двум с половиной миллионам гостей.

“Yandex” вошел в топ-10 поисковых систем. Согласно отчету, размещенному компанией comScore, поисковая машина yandex попала в 10-ку самых фаворитных поисковиков в мире по результатам декабря прошедшего года. Согласно представленному отчету, в декабре было изготовлено 66,2 миллиардов. запросов в поисковике. 566 миллионов из их были заданы Yandex‘у, что позволило сервису занять 9-е пространство в перечне поисковиков. Толика Yandex‘а на мировом рынке поисковых сервисов составила 0,9%.

Rambler (www.rambler.ru)

Rambler – 1-ая поисковая машина российского Веба, возникла на свет в 1996 году. Ее создатели, группа «Стек» из подмосковного Пущино, начинали с сотворения локальной городской сети, и подключения к Вебу. В 1992 году «Стек» запускает собственные ftp- и mail-серверы. Последующим шагом к светлому будущему, сделалось создание поисковой машины. Дмитрий Крюков и Сергей Лысаков начали с того что дали проекту заглавие «Rambler». Им понравилось года, окончательный вариант поисковой машины был готов, а 8 октября «Rambler» был запущен.

Еще год система отлаживалась, к чести создателей поисковик не работал всего одни день – сгорели твердые диски. Существовавшие на то время в Руинтернете две – три поисковых системы не выдержали конкуренции и «канули в Лету».

В весеннюю пору 1997 года возникает неповторимый рейтинг-классификатор Rambler’s Top –100, который не только лишь оценивал популярность русских ресурсов, да и дозволял одним кликом попасть на их. Rambler’s Top –100 стремительно стал всепригодным барометром сети, общим эталоном медиаизмерений.

Последующий шаг в развитии поисковой системы Rambler произошел в июне 2003 года. Компания запустила новейшую версию поисковой машинки, которая различается от предшествующей по двум главным характеристикам. 1-ое и основное – существенно возросла скорость поиска; 2-ое, благодаря новейшей архитектуре системы, обновление поискового индекса происходит пару раз в денек.

сейчас поисковик постоянно находит самые свежайшие документы и крайние анонсы. Rambler знаком с русским языком, соображает определения типа «б/у», «у.е.» и «а/я». Как дань моде, открылась лаконичная версия поисковой машины по адресу «r0.ru». Содержание ее стандартно – строчка поиска, почта и анонсы.

Еще одна неповторимая изюминка поисковика Rambler, это механизм ассоциаций. Кроме обычной ответной странички, в какой отысканные документы размещены в порядке убывания релевантности, возникает строчка — «У нас также отыскивают». В ней приведены слова и словосочетания тематически связанные с запросом. Новейший механизм также исправляет ошибки запросов. На введенное gjujlf юзер получит сейчас хороший результат: сведения о погоде (gjujlf – это слово «погода» набранное латиницей).

Нужно отметить проекты Rambler-Группы и Rambler-Фото. Оба этих проекта предоставляют юзерам сети возможность использования заложенных в проекты программных методах в собственных целях. Проект Rambler-Группы дает людям возможность начинать обсуждения самых различных тем, которые есть не только лишь в виде форумов, но также и в виде открытых списков рассылки. Проект Rambler-Фото представляет юзерам сети возможность сотворения фотоальбомов в объеме до 20 мб, при этом это дисковое место зарегистрированные юзеры поисковой системы Rambler получают в дополнение к тем мб почты, на которые они могут претендовать по новеньким условиям e-mail обслуживания (15 мб).

Rambler Mass Media — 1-ый и как и раньше фаворитный на рынке информационный дайджест. Кроме текстовых материалов и фоторепортажей, ставших визитной карточкой проекта, Rambler Mass Media представляет юзерам аудио и видеосюжеты. В числе поставщиков — ВГТРК и BBC, Deutsche Welle, радио «Маяк» и др. Заглавия важных новостей располагаются на первой страничке портала Rambler.ru и в блоке «Главные анонсы денька» на главной страничке Rambler Mass Media. Более животрепещущие анонсы могут читать и гости остальных сервисов Рамблера — Rambler Почты, Погоды на Рамблере.

Aport
(www.aport.ru)

Поисковая машина Aport в первый раз была презентована на пресс-конференции компании «Агама» в феврале 1996 года. Тогда система работала лишь по веб-сайту russia.agama.com. К моменту официальной презентации, 11 ноября 1997 года, в поисковой машине Aport был проиндексирован 1-ый миллион документов, расположенных на 10 тыщах серверов. Папой www.aport.ruстала компания «Агама» — разраб программного обеспечения для Windows. Это отразилось и на разработке поисковой системы, в отличие от большинства соперников Aport продолжает работать под управлением ОС Windows.

К принципиальным свойствам первой версии поисковой системы Aport можно отнести перевод запроса и ответа на британский язык и назад. 2-ое свойство – реконструкция проиндексированных страничек из своей базы. Это дает возможность просмотра уже несуществующих страничек.

Ноябрь 1998 года – Aport продан гражданину Израиля Джозефу Авчуку. Сумма сделки составила 55 тыщ баксов. Марки «Aport» и «Агама» сохранились, каталогу Ау! подфартило еще меньше. В 1999 году Авчук совсем покупает каталог и переименовывает его в AtRus, а опосля и совсем уничтожает при экспорте на веб-сайты «Омен», «Наша родина он-лайн» и «Aport».

Конец 1999 года – в поисковую машину Aport вложен 1-ый миллион баксов, это позволило, некое время спустя, представить на компьютерных выставках «Aport — 2000». Вполне встроенный с AtRus; сейчас каталог – Aport (Catalog — Aport).

Поисковая машина Aport 2000 была построена на базе выдачи результатов по раздельно взятым веб-сайтам. Для разделения ресурсов на веб-сайты Aport употребляет информацию, которую предоставляет каталог AtRus, либо обладатели ресурсов.

www.aport.ru – первым из поисковых машин Руинтернета воплотил базисные технологии Гугл. «Page rank» — черта популярности ресурса по формуле «оборотных ссылок»: ссылки с остальных веб-сайтов на данный ресурс. При этом учитывается не только лишь количество, да и значимость ссылок. Вес ссылки с пользующегося популярностью веб-сайта больше, а ссылки включающие слова запроса ценятся выше, чем ссылки со словом «тут». К тому же, при обработке запроса поисковая машина Aport 2000 ориентируется на html – код странички, и наличие слов запроса в URL.

Еще одна изюминка — Ценность веб-сайтам, вошедшим в высшую и элитную лиги Aport – каталог. В поисковой машине Aport в первый раз была реализована возможность поиска по новостным лентам.

Первым www.aport.ru стал применять платную нулевую строчку в выдаче. Но на Aport приобрести не нулевое, просто наиболее высочайшее пространство в ответной страничке.

Масштабируемость в архитектуре Aport 2000 построена таковым образом, что его поисковую базу можно дробить на несколько отдельных фрагментов, любой из которых будет работать на собственном компе. Опосля поиска по фрагментам для юзера рассчитывается общий ответ.

31 июля 2000 года Golden Telecom купил семейство интернет-проектов «Агама», включающее «Aport» и AtRus, для включения в «Россию-он-лайн».

Май 2001 — года совсем закончилась сделка по смене обладателя «Aport» самого «Golden Telecom», новеньким обладателем стал «Альфа-Банк». NASDAQ к тому времени переживал бурный спад, и шансов перепродать веб проекты за приемлемую сумму не было. Это определило решение новейших владельцев «Golden Telecom» минимизировать расходы на поддержку дорогостоящих веб проектов.

MSN Search (www.msn.ru)

Когда-то MSN Search был одним из наилучших поисковиков, да и сейчас он как и раньше стоит внимания. MSN Search воспользовался каталогами веб-сайтов LookSmart и получал наилучшие отзывы юзеров, так как за проектом стояла команда редакторов, которая выслеживала более нередкие запросы, вводимые в поисковую форму, и подбирала веб-сайты, более релевантные теме запроса. Таковая методика давала отличные результаты.

Сейчас MSN Search отыскивает новейшие пути развития. Система производит поиск по материалам Яху, но не различается той функциональностью и разнообразием характеристик, которые дает сам Яху. В то же время, MSN Search разрабатывает собственные боты и планирует остальные перемены, которые должны вполне обновить систему.

(www.msn.com)

У поисковой системы МSN (msn.com) никогда не было собственного паука либо каталога. С 1997 года система МSN для выдачи поисковых результатов употребляла различные базы данных, такие как: Яху!, LookSmart, Altavista, DirectHit, Inktomi и RealNames. на данный момент поисковые результаты берутся из Inktomi, LookSmart, Direct Hit.

Но, все-же, MSN.com один из самых фаворитных порталов Веба. Там же есть и поисковая машина search.mns.com. Система МSN в особенности принципиальна, т.к. конкретно этот поисковик по дефлоту употребляется, когда юзеры Internet Explorer’а вводят в адресную строчку поисковый запрос. Система МСН также является информационным узлом, и по данным MediaMetrix, является одним из более посещаемых веб-сайтов.

msn.com употребляет базу данных Inktomi, но эта база данных на данный момент содержит наиболее наиболее 550 миллионов URL и не понятно, какую часть употребляет поисковая машина MSN. Понятно, что из базы данных LookSmart употребляется около 2 миллионов URL.

Поисковая машина МСН (msn.com) локализована приблизительно для 30 государств, таковых как: Англия, Дания, Бельгия, Новенькая Зеландия, Япония и др. Также эта система предоставляет юзерам возможность сортировать поисковые результаты: по дате, по алфавиту, по релевантности.

Не так давно, в конце 2004 года, портал MSN.com объявил о запуске официальной версии собственного поиска, спустя два года опосля объявления о начале разработки собственного поисковика. Ранее продемонстрированная бета-версия поиска выкачена на всех веб-сайтах портала и растеряла отметку «beta». По сопоставлению с уже знакомой бета-версией, сегодняшний поиск заполучил несколько новейших способностей, а а именно:

— Интеграция с MSN Direct Answers — службы, базирующейся на электрической Microsoft Encarta и расширенной сейчас до 1,5 миллионов статей.

— Выдача поисковых результатов в RSS-формате — при всем этом существует ограничение на внедрение этих результатов и запрет на их внедрение в коммерческих целях.

— Поиск по RSS.

Хотя при разработке поисковика MSN.com использовалось большая часть принципов оптимизации, которые и в остальных поисковых системах не будут сюрпризом для большинства проф участников он-лайн рынка.

В связи с пуском поиска проведен также редизайн всего веб-сайта MSN.com, а на портале размещено воззвание Билла Гейтса к юзерам. В наиблежайшее время MSN планирует запустить также поиск по блокам, несколько специализированных поисков (можно представить, что это будет поиск по видеофайлам — он уже есть у Яху и Гугл) и свою программку контекстной и поисковой рекламы. на данный момент основная масса рекламы, демонстрируемой на поисковых результатах, является рекламой Overture, которая принадлежит одному из соперников новейшей системы MSN — Яху! Inc.

Но, поисковик уже заполучил существенное воздействие и, если веровать слухам, MSN Search все-же бросил вызов Гугл и Яху в борьбе за первенство на рынке.

Яху! (www.яху.ru)

В 1994 году, студенты Стэндфордского института, Джерри Янг и Дэвид Фило, готовились к защите диссертации в области компьютерного проектирования интегральных схем. Для этого им приходилось много времени проводить в сети Веб, в поисках подходящей инфы и накапливать ссылки. Списки со ссылками росли, позже Янг и Фило забросили диссертацию и принялись только собирать ссылки. К середине 1994 года их сделалось много, они отсортировали ссылки по категориям, позже в категориях ссылок сделалось тоже много, возникли подкатегории. Но перечень Джерри и Дэвида не был предназначен для всеобщего обозрения — он составлялся только для друзей. время шло, а посещаемость все росла и росла. адресок веб-сайта начал двигаться по рукам.

Первым шагом к успеху сделалось новое, запоминающееся заглавие – Яху! Следуя пожеланиям юзеров, создатели www.Яху.com, стали преобразовывать веб-сайт. Возникли новейшие группы, и разделы «What’s New» и «What’s Cool». К концу 1994 Янг и Фило забросили свои диссертации и вполне отдались работе над поисковиком Яху.

В это время на дороге возникла компания Netscape, предложившая ресурсы для содержания поисковой системы Яху!. В итоге у Яху! возник собственный домен — яху.com, и каталог переехал на 10 станций Silicon Graphics Indy. Приблизительно в это время Яху! получил и первого инвестора — вкладывательный фонд «Seqouia Capital». Джерри и Янг обзавелись кабинетами и наняли энергичную команду web-серферов. Темп роста составил, в среднем, 1000 страничек в денек.

12 апреля 1996 года www.Яху.com выпустил свои акции. При номинальной стоимости в 12 баксов за штуку к концу денька они продавались уже по 33 бакса. Создатели Яху первыми стали использовать рекламу собственного ресурса в печатных СМИ и на телевидении.

Новейший управляющий поисковой системы Яху! — Тим Кугл решил развить Яху из обычного списка упорядоченных линков до реального портала. А из денежных новостей создать аукционы, добавляя к ядру Яху.com элементы онлайнового доступа.

Последующие вложения в поисковик Яху! составили 560 миллионов баксов. Яху.com взрослеет и начинает действовать на рынке как самостоятельная акула капиталистического мира. Соперники, в лице America Online и Microsoft, сбиваются в разные корпоративные альянсы, чтоб крепить свои позиции в бизнесе. Подсмотрев у «противников» способы, Яху в 1999 году приобретают поставщика бесплатной электрической почты rocketmail.com. В то время на просторах Веба возникают разные веб-сайты, претендующие на звание портал. С соперниками расправляются по-разному. Webring.com приобретают, с остальными воюют на бирже.

В 2000 году поисковая машина Яху запустили проект под заглавием Corporate Яху! и приобрели тайваньский бизнес-сайт Kimo, чем заявили о желании двигаться на широкий китайский веб-рынок.

На нынешний денек Яху.com одна из главных поисковых машин в Веб. Предоставляющая услуги 200 миллионам человек за месяц.

Сегодняшнее развитие Яху можно найти как движение в он-лайн, интерактивность. Яху стремительно осваивает эту область веб-услуг, но возникает одна неувязка: ядро Яху! не было на это рассчитано. Не была в 1994 году заложено в него «он-лайновая» составляющая, ее «наклеил» Тим Кугл несколькими годами позднее. естественно возникает угроза хакерских атак через эту незащищенную область.

Одно из новшеств поисковой системы Яху — панель задач для браузера Firefox,. Этот инструмент помогает воспользоваться поиском Яху, не заходя на официальный веб-сайт, а только используя многофункциональные клавиши панели.

1 сентября 2005 года поисковик Яху, которому принадлежит наиболее 200 миллионов адресов электрической почты по всему миру, анонсировал пуск новейшей системы поиска текстов, фото и остальных документов, содержащихся в письмах.

Необходимость такового нововведения появилась вослед за повышением объёма хранимых данных, ведь некие юзеры делают целые почтовые архивы. Подгоняемый соперником Гугл и его почтовым обслуживанием Gmail, Яху для хранения почты дает с этого момента 1 гб бесплатного места, либо 2 гб по годичному абонементу. «Как вы получаете возможность хранить больше инфы, для вас нужны и расширенные поисковые способности«, — разъясняет Эрик Петерсон, аналитик компании JupiterResearch. «

Юзеры поисковой машины Яху, в свою очередь, сумеют сейчас применять способности детализированного поиска слов в заглавии либо конкретно в тексте письма, также в присоединенных документах, не открывая их. Итог поиска отражается в трёх строчках с указанием всех атрибутов. На панели справа показываются все похожие документы. Отысканные фото выводятся на экран в уменьшенном виде, что существенно упрощает поиск. Система также учитывает орфографические ошибки, позволяя находить слова только по первым буковкам.

Для начала www.Яху.com планирует предложить новейшую систему маленькому числу американских юзеров, а потом распространить её по всему миру. Со стороны клиентов это не востребует никаких доп усилий. «Когда услуга станет доступна, в левом верхнем углу странички вашего почтового ящика покажется соответственный баннер«, — обещает компания Яху.

По данным comScore Media Metrix на июль этого года, домену Яху принадлежит 219 миллионов адресов электрической почты, что составляет 31,5% мирового рынка, уступая только Microsoft с 221 миллионом юзеров сервиса Hotmail (35,5% рынка).

11 октября 2005 года, стремясь ни в чем не отстать от наикрупнейшго соперника, компания Яху объявила о намерении сделать цифровую библиотеку. При этом не очень удачный опыт Гугл, погрязшего в судебных разбирательствах с правообладателями, компанию не стращает, а быстрее напротив — подстегивает.

Напомним, что Гугл некое время тому вспять заключила контракт на оцифровку книжек в больших европейских и американских институтах и библиотеках, но попытка сделать крупнейшую в мире библиотеку электрических текстов вызвала гневное сопротивление опасающихся за свои доходы издателей и создателей.

Целями же Яху стали книжки из библиотеки Калифорнийского института, от издательства О`Рейли, прославившегося своими учебниками, и Государственного Архива Англии. Войдут в «стартовый пакет» и книжки из фонда Евро Архива. Избежать затяжных судов компания хочет методом предложения пользователям получить разрешение на просмотр данных текстов от правообладателей перед переходом на «полновесный» текст. При всем этом поисковая машина Яху рассчитывает поделиться с иными поисковыми сервисами возможностью проводить поиск в данной для нас «библиотеке», в то время как Гугл способности собственной несостоявшейся библиотеки разделять ни с кем не подразумевала.

Посреди 2005 года, компания Яху, официально объявила о достижении принципиального достоинства в борьбе со своим основным соперником на рынке сетевого поиска — компанией Гугл. Менеджеры считают, что поисковик Яху дозволяет отыскать вдвое больше документов, чем Гугл. По их воззрению, база данных поисковой машины Яху содержит в себе 20,5 миллиардов. объектов — 19 млрд текстовых документов и 1,5 млрд изображений. Таковым образом, ее поисковый индекс (число объектов, которые юзер может отыскать в вебе с помощью поисковика), практически вдвое превосходит аналогичный показатель поисковой системы интернет-корпорации Гугл — 11,3 млрд объектов, из которых 8,2 млрд текстовых документов и 3,1 млрд изображений.

Ранее Яху никогда не открывала Яху обхватывал от 6 до 8 млрд объектов в сети. Согласно официальному сообщению, в первый раз в истории Яху, высококачественный прорыв в конкурентноспособной борьбе с Гугл обеспечила крайняя, очень удачная модернизация поисковой системы. «У юзеров веба возникла весьма весомая причина направить на нас внимание, — заявляет вице-президент компании Яху Экхарт Уолтер. — Наша поисковая машина обхватывает намного больше инфы, чем любые остальные».

«Яху принудила юзеров усомниться в том, что Гугл — самая мощная поисковая машина. Это дает компании Яху доп преимущество в борьбе за Лидерство на рынке. Бренд Гугл для почти всех стал синонимом поиска инфы в вебе. Задачка Яху состоит в том, чтоб пошатнуть доверие к этому бренду», — считает аналитик компании Forrester Research Карлин Ли.

Вот чем живет www.Яху.com сейчас, когда стоимость одной акции уже подкралась к $200. на данный момент поисковая машина Яху! достигнула критичного размера — команде серферов с трудом удается поддерживать ее актуальность и добавлять тыщи новейших веб-сайтов раз в день.

Достоинства и недочеты поисковых машин

Таблица 2

Поисковая машина

Достоинства

Недочеты

Rambler

1) Система работает с большенный скоростью поиска.

2) Обновление поискового индекса происходит несколько раз в денек.

3) Поисковик постоянно находит самые свежайшие документы и крайние анонсы.

4) Владеет близким к хорошему выводом поисковых результатов.

5) производит ранжирование результатов зависимо от частоты потребления и местоположения разыскиваемых определений.

6) один и этот же документ в разных шифровках показывается лишь один раз, а его определенные адреса суммируются в перечне, идущим за резюме.

1) На величину индекса релевантности влияет время существования веб-сайта в сети. Эта изюминка дозволяет юзерам отыскивать ресурсы, которые издавна есть, удачно развиваются, а не сайты-однодневки. Но таковой подход существенно затрудняет попадание в выдачу новейших веб-сайтов, информация на которых тотчас оказывается животрепещущей и, может быть, наиболее принципиальной для юзера.

2) невозможность воплощения поиска по целой фразе указывая в запросах предельное расстояние разыскиваемых определений друг от друга.

Yandex

1)Неизменное развитие системы.

2)Свойство выдачи вырастает, больше комфортных сервисов дает компания: каталог, карты, анонсы, прогноз погоды, почта.

3) глубочайший морфологический анализ обрабатываемых определений.

4) владеет неплохим механизмом определения 1-го документа в нескольких шифровках либо на зеркальных серверах.

5) оригинально сконструированный механизм выдачи результатов.

6) большущая индексная база.

1) Разница в выдаче при наборе слова с большенный (малеханькой) буковкы (время от времени выдача изменяется, время от времени нет).

2) Нередкое выпадение секторов поисковой базы — когда исчезают части веб-сайтов из выдачи и восстанавливаются через 2-5 дней.

3) Обновление индексов поисковой базы происходит недостаточно нередко и часто.

Гугл

1) Весьма мощная поисковая машина, которая находится в неизменном развитии.

2) база индексов данной для нас системы обновляется раз в два денька, свойство выдачи весьма высочайшее, отыскать нужный документ либо информацию достаточно просто.

3) Система нацелена в главном на ссылки, при этом учитываются как входящие, так и исходящие ссылки с ресурса.

4) Способна выдавать результаты на запросы по семантике языка программирования (начальный код поиска).

1) Часто встречаются ссылки на веб-сайты с уже устаревшей информацией.

2) Случается, что ссылки, которые находятся в поисковых результатах, ведут на веб-сайт, находящийся в стадии разработки.

3) На запрос «кинофильм» и «киноленты» поисковые результаты будут различаться.

4) отсутствие способности указать определенную грамматическую форму слова, или ударение также существенно усложняет процесс поиска инфы.

Aport

1)содержит достаточно удачный в использовании каталог.

2)широкие способности составления запроса.

3) автоматический перевод запроса с российского на британский язык и напротив.

4) Реконструкция проиндексированных страничек происходит из своей базы. Это дает возможность просмотра уже несуществующих страничек.

1)не постоянно стремительно находит то, что от него просишь.

2) каталог не обновлялся уже весьма издавна.

3) способен выделять один и этот же документ в разных шифровках и выдавать ссылку на него только один раз, перечисляя определенные адреса в перечне URL.

4) не постоянно корректная обработка заглавий страничек, из-за чего же в поисковых результатах нередко указывается “документ без наименования”, в то время как метки title на большинстве таковых страничек содержат принципиальные данные.

MSN

1) Предоставляет юзерам возможность сортировать поисковые результаты: по дате, по алфавиту, по релевантности.

2) При осуществлении поиск по главному слову, команда профессионалов компании выслеживает более релевантные на их взор веб-сайты, вручную отбирают и систематизируют их, и заносят в определенные рубрики директории.

3) ранжирования узлов по популярности и сезонным изменениям.

4) Помощь со стороны человека-редактора.

1) Поисковая машина полна мусором.

2) Употребляет наружные данные для обработки запросов в поисковике, потому на релевантность влияют: размещение главных слов, популярность ресурса и текст ведущих на веб-сайт, и ведущих с веб-сайта ссылок.

Яху!

1) Содержит ссылки, которые более много отвечают обозначенной в запросе теме.

2) Имеются умственные средства «отсечения» пустых, находящихся в разработке либо чисто маркетинговых веб-сайтов, дальних от разыскиваемой темы.

3) постоянно просто найти, в котором разделе находится подходящая информация.

4) В случае если на Яху нет результатов, сходу выводятся результаты с AltaVista.

1) Вероятна неувязка с отсутствующими страничками, так как Интернет-мастера обычно запамятывают удалить свои веб-сайты с поисковых машин, а на Яху нет механизма автоматического обновления.

2) Чисто российские ресурсы не добавляются, поэтому что их просто некоторому глядеть и оценивать содержимое.

2)Нет своей поисковой машинки.

3) Отыскивает слова, данные в аспекты поиска лишь в заглавии и описании странички

Сравнительный анализ работы разных поисковых машин:

1.
Определила тему поиска.

2.
Сделала поисковый запрос (однообразный для всех поисковых машин).

3.
Поисковые результаты (количество ссылок) расположила в таблицу.

4.
По результатам поиска сделала уточняющие запросы в поисковике (с учетом правил работы в определенной поисковой машине), чтоб уменьшить количество нерелевантных ссылок. Уточняющие запросы создавала до того времени, пока поисковые результаты станет может быть проанализировать – 10 ссылок.

5.
Результаты уточняющего поиска (количество ссылок) расположила в таблицу.

6.
Проанализировала 10 первых отысканных ссылок на предмет релевантности.

7.
Пришла к выводу о качестве поиска каждой поисковой машиной и поставила оценки по пятибалльной шкале.

Таблица 3

Что такое тезаурус и каковы правила его сотворения?

Поисковые системы

Яndex

(стр.)

Rambler

(док-ов)

Гугл

(веб-сайтов)

Aport

(веб-сайтов)

MSN

(веб-сайтов)

Яху!

(веб-сайтов)

Поисковый запрос

75.000

2.676

24.600

1.946

9.770

16.800

Уточняющий
Запрос

7.453

189

20.400

443

543

417

Анализ первых 10 отысканных ссылок

Нет ничего

Подходящая ссылка оказалась на 2 страничке под номером 13

ничего нет

Подходящая ссылка оказалась на 5 страничке

ничего нет

Опосля просмотра 10 страничек = 100 ссылкам – ничего не найдено

Подходящая ссылка на первой страничке под номером 10

ничего нет

Подходящая ссылка оказалась на 3 страничке

ничего нет

Подходящая ссылка оказалась на 2 страничке под номером 16

Кол-во релевантных ссылок

Вывод-Оценка по пятибалльной шкале

Модель «безупречной» поисковой системы

Поисковые машины являются инвентарем, которым сейчас пользуется большая часть гостей Веба. Современные поисковые системы начинают тяготеть к порталам, расширяя предлагаемые способности и не ограничивая юзеров лишь поиском.

Поисковики
– это собственного рода монополисты. Они ведут сокрытую политику, диктуют свои правила, не разглашая их при всем этом. А тотчас, даже просто беспредельничают и демонстрируют поразительную необъективность по отношению к веб-сайтам. Возникает ситуация, что оптимизаторы не могут ясно осознать, каким он должен быть, «неплохой» веб-сайт в осознании поисковика. Как создать его таковым, чтоб поисковик считал его более релевантным по запросам. И конкретно из-за данной для нас неопределённости и появляются у вэб-мастеров желание обхитрить систем.

Выход из данной для нас задачи – создание вполне ОТКРЫТОЙ поисковой системы, в какой бы ранжированием занимался не только лишь поисковик да и сами Интернет-мастера.
Чтоб в ней может быть было открыть все механизмы и методы ранжирования и при всем этом беспристрастно оценивать веб-сайты меж собой.

Основной недочет современных поисковых машин – это их централизация. А централизация значит, что вся информация хранится в одном месте, все работы и расчёты выполняются в одном месте, все решения (результаты выдачи) принимаются в одном месте.

Итак, почему это недочет, тут несколько обстоятельств:

1) Полная централизация просит колоссальных ресурсов – это большие базы данных, огромное количество компов и т.д. Беря во внимание темпы роста Веба в не далеком будущем придется использовать просто неописуемые мощности.

2) Лишь при управлении в одном центре можно достигнуть полной конфидициальности. А потому что по нашей концепции поисковая машина обязана быть открытой, то и необходимость в централизации отпадает вполне.

3) Поисковая машина не постоянно может верно оценить определенный ресурс. Вернее самому владельцу веб-сайта поручить выполнение ранжирования документов снутри веб-сайта. И сейчас, самое основное как уйти от централизации и убрать все эти минусы — это внедрение в любой веб-сайт собственной минипоисковой системы. Эта минипоисковая система будет регистрировать содержимое веб-сайта по правилам самого носителя веб-сайта. Лишь вэбмастер будет решать, какие странички его веб-сайта по каким запросам наиболее релевантны. А позже свои индексы уже будет отправлять на поисковой машины.

Ещё одной из главных заморочек при разработке новейшей поисковой системы является учет представления юзеров.

Попытка конкретного выявления представлений юзеров о безупречной поисковой машине обычно не приводит к подходящему результату: юзеры перечисляют все, что когда-либо лицезрели либо употребляли в имеющихся системах. Не стоит ожидать от юзеров способностей проектирования – они навряд ли сумеют стремительно обрисовать, как обязана смотреться безупречная поисковая машина.

Наиболее продуктивным подходом к решению данной для нас задачи является анализ безупречной модели поисковой машины, которой оперируют юзеры. Безупречная модель – это совокупа представлений юзера о целях, функциях, структуре, методах контроля и управления, вероятных действиях с системой, которые определяют его деятельность. Таковой подход – от анализа представлений юзеров и построения безупречной модели к проектированию интерфейсов продукта — понижает риск того, что продукт не понравится юзерам, не будет принят и нужен ими.

В безупречной модели должны находиться последующие составляющие:

· Primary nouns (
электрическое письмо, продукт в веб-магазине, картина, доступная для просмотра в Вебе) – это главные элементы, с которыми юзер производит деяния либо манипуляции при работе с системой.

· Сценарий использования
— это описание представлений юзеров о содействии с системой, разбитое на простые шаги. Сценарий использования иллюстрирует системы.

· Диаграмма задач
является графическим отображением представлений юзеров о списке решаемых в системе задач.

· Диаграмма навигации
показывает представления юзеров о порядке смены экранов, с которыми они сталкиваются при работе с системой, и содержании этих экранов. Диаграмма построена на базе сценариев использования системы и употребляется в процессе проектирования интерфейсов.

Для получения всех данных, нужных для составления безупречной модели, было проведено интервью маленького числа юзеров, а потом – веб-опрос. Интервью позволило осознать, какие вопросцы и каким образом необходимо задать, чтоб получить полную картину: кто является юзером поисковой системы, каковы его потребности и задачки, каким образом он привык решать задачки и каким лицезреет путь решения новейших, необычных задач.

Проанализированные ответы дозволили выстроить модель безупречной поисковой системы. В итоге исследования были получены выводы о том, чего же не хватает юзерам в имеющихся поисковых системах, также того, что не нравится юзерам. Эта информация дозволила выделить макеты, делая упор конкретно на портрет мотивированной аудитории, которая будет работать с поисковой машиной, беря во внимание предпочтения юзеров и индивидуальности их работы. Итак, что у нас вышло?

Неувязка 1:
Оптимизаторы не могут ясно осознать, каким должен быть, «неплохой» веб-сайт в осознании поисковика и как создать его таковым, чтоб поисковик считал его более релевантным по запросам.

Решение данной для нас задачи отлично реализовано в поисковой машине MSN Search. В системе ранжированием занимается не только лишь поисковик, но ему также помогает человек-редактор. Благодаря этому, при осуществлении поиск по главному слову, команда профессионалов компании выслеживает более нередкие запросы, вводимые в поисковую форму, и подбирает веб-сайты, более релевантные теме запроса, а так же вручную отбирают и систематизируют их, и заносят в определенные рубрики директории. Что, к примеру, в сопоставлении с самой пользующейся популярностью поисковой машиной мира – Гугл, которая сама описывает релевантность Веб-страниц (страничка, на которую ссылаются почаще, наиболее релевантна и означает наиболее популярна) помогает избежать данной для нас задачи.

неувязка 2:
Наличие доступных и понятно изложенных правил по специальному синтаксису каждой отдельной поисковой системы.

Согласно моему исследованию изложение доступных и понятно изложенных правил по специальному синтаксису находится в последующих поисковых системах:

— Яndex;

— Гугл;

— Aport;

Неувязка 3:
Высочайший уровень релевантности выдаваемой инфы.

Используя опыт, приобретенный в процессе выполнения курсовой работы, и опыт использования поисковых машин в жизни в целом, представляю перечень поисковых машин (начиная с той, у которой наиболее релеванты результаты поставленным запросам), поисковые системы, не надлежащие, по моему воззрению, аспекту «релевантность выдаваемой инфы» не войдут в представленный ниже перечень:

— Яndex;

— Aport;

— Гугл;

Неувязка 4:
Спрос на поисковые машины, которые больше напоминают Веб-портал, где можно завести почтовый ящик, узнавать курс валют и прогноз погоды, читать блоги и форумы.

Этому аспекту юзеров отвечают:

Поисковые системы

Почтовый ящик

Курс валют

Прогноз погоды

Блоги

Форумы

Яndex

—

Гугл

—

Rambler

—

Aport

—

MSN

—

Яху

—

Получили, что всем нужным аспектам не соответствует ни одна и рассмотренных нами поисковых машин. Поближе всего к эталону находятся поисковые системы Яndex, Rambler, Aport. За ними следуют Гугл и MSN, и заключает шестерку ведущих поисковых машин – Яху.

Общий вывод:
по рассмотренным аспектам поисковая машина Яndex больше всех приближена к модели «безупречной» поисковой системы. А такие поисковики как Гугл и Aport поочерёдно делят то 2, то 3 места. Отметим также, что поисковая машина MSN лидирует в системе ранжирования.

Советы по применению поисковых машин:

1-ый вопросец, который возникает у начинающего юзера Веба: «Как отыскать нужную мне информацию?» До этого всего, мы должны отметить, что нет «правильных» либо «некорректных» путей поиска в Вебе. Непременно, одни из их могут востребовать больше времени, чем остальные, но в конечном счете предпочтение обязано отдаваться тому способу, который кажется более комфортным и действенным определенному юзеру Веба.

Представьте для себя, что Для вас необходимо отыскать потерявшуюся вещь в Вашем доме. Вы сможете применять несколько методов поиска:

1
. Планомерно обыскать все шкафы и полки;

2
. Находить лишь там, где, по Вашему воззрению, может находиться эта вещь;

3
. Спросить родных: маму, деток, супругу либо супруга о месте, где может находиться разыскиваемый предмет либо нечто схожее на него.

естественно, могут быть и остальные методы… Но в каждом отдельно взятом случае лишь один из 3-х перечисленных способов будет более удачным. Аналогичный принцип применяется при поиске в хоть какой поисковой машине: Вы сможете находить в новостях, файлах либо во всем Вебе. Вы даже сможете находить лишь на определенном веб-сайте (лишь в одном шкафу), если Вы понимаете, что разыскиваемый объект спрятался конкретно там. Но следует учесть, что поисковые боты могут обойти лишь те места, куда его пускают (заглянуть лишь в те шкафы, дверцы которых не заперты).

Буквально так же, как и дома, в каждом отдельно взятом случае один из методов может оказаться эффективнее другого: в Вебе подходящий объект либо веб-сайт может найтись совсем не там, где ожидалось

Начните находить — это просто

Поисковые машинки не требуют от вас познания особых установок для поиска. Довольно набрать вопросец — так же, вроде бы вы его задали библиотекарю либо всезнайке-эрудиту. к примеру, где раки зимуют? Яркая звезда северного полушария
?

Морфология учитывается

Независимо от того, в которой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам российского языка. Это именуется учет морфологии слов. По мере необходимости вы постоянно сможете его отключить.

Что такое верный запрос?

Верный запрос состоит из нескольких слов, поэтому что по одному слову обычно тяжело осознать, что вы желаете отыскать. К примеру, запрос дизайн может означать желание отыскать информацию о дизайне интерьера, либо о веб-дизайне, а может — о ландшафтном дизайне. По такому запросу поисковик отыщет странички обо всех узнаваемых ему видах дизайна. Обычно поисковые системы отлично соображает запросы из нескольких слов и способны без помощи других их интерпретировать. Они знают, в которых вариантах нужно находить странички, в каких слова запроса размещены , а когда довольно словам повстречаться в одном документе, чтоб страничка отлично соответствовала запросу.

Ищете цитату?

Если вы желаете отыскать точную цитату, просто задайте разыскиваемую фразу в кавычках: «о закрой свои бледноватые ноги«. По такому запросу будут найдены все странички, в каких есть подходящая для вас цитата.

Ищете имена?

слова с большенный и малеханькой буковкы числятся различными формами 1-го слова, потому все равно, какой регистр применять в запросе. Исключением является оператор четкой формы. По запросу ‘!лужков’ будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу ‘!Лужков’ — лишь документы, в каких имеется форма ‘Лужков’ с большенный буковкы. Это полезно, если разыскиваемое имя собственное совпадает с всераспространенным именованием нарицательным, к примеру, село !Кошки либо !Прост.

Непременно найдите слово!

Чтоб отобрать документы, где определенное слово находится непременно, поставьте перед ним плюс (без пробела). Потому, если вас интересует цитата из «Гамлета», вы сможете задать запрос +быть +либо +не быть. Малая хитрость: этот же итог можно достигнуть, задав «неотклонимые» слова в кавычках: «быть либо не быть».

Как исключить слово?

Чтоб исключить документы, в каких встречается определенное слово, поставьте перед сиим словом два знака тильды либо один минус (без пробела). К примеру, если для вас необходимо описание Парижа, а не предложения бессчетных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Либо запрос путеводитель по Парижу -агентство –тур
.

Заключение

Поисковые системы обычно состоят из 3-х компонент:

· агент (паук либо кроулер), который {перемещается} по Сети и собирает информацию;

база данных, которая содержит всю информацию, собираемую пауками;

поисковый механизм, который люди употребляют как интерфейс для взаимодействия с базой данных.

Во время путешествия по Вебу, для вас непременно пригодиться помощь поисковой машинки. Весьма нередко приходится находить информацию в сети не зная даже примерно адресок странички, на которой она может размещаться. В таковых вариантах на помощь приходит поисковая машинка.

Поисковые машинки — это механизированные системы. Особая программка-робот, которую именуют паук либо ползун, повсевременно обходит сеть в поисках новейшей инфы, которую она заносит в базу данных. база данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

При поиске в Вебе важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего излишнего). Обычно это все именуют одним словом – релевантность, другими словами соответствие ответа вопросцу. Необходимыми показателями являются охват и глубина поисковой машинки (как велика база данных по документам), скоростью обхода и актуальностью ссылок (скорость обновления инфы в данной для нас базе данных), качеством поиска (чем поближе к началу перечня оказывается подходящий для вас документ, тем лучше работает релевантность).

Не считая релевантности, есть принципиальные пользовательские свойства: скорость поиска (неспешная поисковая машинка неэффективна в работе), поисковые способности (как конкретно происходит индексация: лишь по главным словам web-страницы либо по всему тексту, с учетом морфологии либо без него, с поиском по тэгам html — заголовкам, ссылкам, подписям к изображениям и др.), также доп удобства (удачный интерфейс, наличие особых функций, к примеру, поиск по датам и серверам). тут все зависит от того, что вы предпочитаете.

Посреди ведущих поисковых систем на данный момент — Яndex, Гугл, Rambler, Aport! и др.

анализ поисковых машин Веб

Исходя из темы курсовой работы «Сравнительный обзор современных поисковых машин»
.

Поисковые результаты представлены в последующей таблице.

Таблица 4

страничек

веб-сайтов

cайтов/

документов

веб-сайтов

Современные поисковые системы

5 000 000

4 730 000

13 054/

65 133

107 045

483 000

591 000

Пользующиеся популярностью поисковые машины

10 000 000

438 000

4 238 /

42 618

54 016

944 000

148 000

Обзор поисковых машин

1 000 000

149 000

7 038/

84 553

13 364

139 000

28 200

Достоинства и недочеты поисковых машин

53 000

8 620

218/ 298

2 258

11 200

3 230

Сравнительный анализ работы поисковых машин

809 000

71 400

369 / 917

10 069

28 100

13 900

«Безупречная» поисковая машина

83 000

9 210

4 458 /

23 838

5 172

9 060

43 600

Советы по применению поисковых машин

635 000

124 000

926/

1 811

29 147

35 200

72 800

Общее заключение о наличии материалов в веб по теме курсовой

Степень актуальности того либо другого предмета исследования определяется, основным образом, исходя из размера имеющейся по данному вопросцу литературы. В процессе осуществленного поиска в Internet мною было найдено огромное количество инфы, касающейся систематизации, обзора и анализа современных поисковых машин. Исходя из размера представленной литературы как на британском, так и на российском языках, можно прийти к выводу, что к истинному времени поисковые машины пользуются большим спросом посреди юзеров сети Internet.

анализ статистики по таблице 4

По данным, представленным в таблице поиска, можно рассматривать эффективность каждой из представленных 7 поисковых машин исходя из убеждений количества отысканной инфы, а конкретно веб-сайтов, имеющихся в системе по раздельно данному запросу. анализ я производила по последующему принципу: Учитывалась изюминка поисковых машин по языковой принадлежности, анализ выполнялся по 6-ти системам. В процессе анализа статистики мною были выявлены последующие закономерности: наибольшее количество веб-сайтов по запросу на российском языке посреди русских систем было выдано поисковыми машинами Yandex и Гугл, при всем этом характеристики Yandex существенно превосходят Гугл, дальше в порядке понижения эффективности следуют системы Aport, Rambler и MSN соответственно Яху, как английская система, показала наихудший итог при поиске главных слов, данных на российском языке. Таковым образом, фаворитные позиции по показателям количества представленной инфы занимают поисковые машины Yandex и Гугл и Aport.

анализ разных поисковых машин по степени эффективности

Фаворитами по показателям свойства представленной инфы оказались Yandex, Гугл и Aport.

Yandex оказался одной из более действенных систем исходя из убеждений ее релевантности и соответствия выданных результатов данному запросу. Хоть страничек было много, но подходящая информация находилась на самых первых из их. Не много затраченного времени – нужные результаты. При всем этом немаловажную роль сыграла также относительная новизна представленной инфы.

Гугл выдавал результаты страничек, на которых не постоянно 1-ое пространство занимали релевантные документы. Зато жалоб на обилие просто не было, т.к. в представленном количестве материала можно было отыскать что угодно ( при всем этом было потрачено времени вдвое больше, по сопоставлению с поисками в остальных поисковых системах).

Система Aport оказалась наименее действенной, чем вышеназванные из-за ее лишней ориентации на личные случаи, но результаты, которые она выдавала, существенно отличались от результатов остальных поисковых машин. Они были единственные в собственном роде, не постоянно релевантны, но неподражаемы.

Rambler, невзирая на крепко занимаемое 4-ое пространство в количественном рейтинге, оказался намного наименее действенной по релевантности системой. тут преобладает ориентация на русские источники инфы, что понижает ее адекватность в оценке ситуации в остальных странах. К данной для нас же группы по степени релевантности можно отнести и поисковую машину Гугл.

Поисковую машину Яху можно разглядывать как более эффективную вровень с Yandex, но лишь в английском поиске. На российском языке в данной системе имеется незначимое количество веб-сайтов и их релевантность мала.

Общий анализ ситуации с поиском и предоставлением инфы в современном Internet

Исходя из личного опыта неизменного юзера я обязана сказать, что сейчас в критериях неизменных высококачественных конфигураций во всех сферах жизни и неизменном движении людской мысли вперед, Internet является более принципиальным и более нередко применяемым источником инфы. Большая полезность глобальной сети состоит в доступности инфы хоть какому юзеру и постоянной обновляемости ресурсов, что дозволяет повсевременно быть в курсе новейших событий.

Применяемые источники:

1. www. Гугл.ru

2. www.yandex.ru

3. www.rambler.ru

4. www.aport.ru

5. www.msn.ru

6. www.яху.ru

7. http://company.Yandex.ru/articles/article10.xml

8. http
://www.citforum.ru/internet/search/searchsystems.shtml

9. HTTP://www.intelsib.ru/

10. http://www.seonews.ru/news/.info_news/2385/

11. HTTP://www.seo-gu.ru/im_stat.html

12. http://www.relevantno.ru/news/html/1138782965.html

13. http://www.vadimstepanov.ru/f_texts/column6.htm

14. HTTP://book.itep.ru/4/45/retr4514.htm

15. HTTP://www.seoexp.com/ru/history/search_engines/

16. http://smo.me/uncategorized/история-создания-компании-google/

17. www.гугл.com/codesearch

]]>

Перейти и растаять в своей любимой социалке

Учебная работа. Курсовая работа: Сравнительный обзор современных поисковых систем

Учебная работа. Курсовая работа: Сравнительный обзор современных поисковых систем

Как? Вы еще не читали? Ну это зря...