Великий Путь Вебмастера от идеи до интернет бизнеса
Блог Романа Чуешова
Начни зарабатывать на создании сайтов, лендингов, мобильных приложениях и новейших интернет технологиях
Рубрика:Разное

Информационно поисковые системы и их классификация: история, характеристики, цифры, факты и многое другое

Добрый день, уважаемые читатели! Сегодня я хочу предложить вашему вниманию такую важную для любого пользователя тему, как информационно поисковые системы и их классификация. Поскольку именно с них начинается так называемый «серфинг» в Интернете, стоит найти время на их более подробное изучение.

Статья получилась довольно объёмной – уж больно обширен предмет изучения. На сегодняшний день существуют десятки поисковиков различной степени популярности. Надеюсь, что, осилив текст до конца, вы сможете выбрать тот, который в наибольшей степени соответствует вашим текущим задачам. Итак, начнём.

Для удобства чтения привожу оглавление:

  1. Определение и суть термина
  2. Немного истории
  3. Виды и характеристики
  4. Цифры и факты
  5. Поисковики в деталях

Определение и суть термина

Что, собственно, такое поисковая система? Это механизм поиска информации, основанный на отборе необходимых данных в базе (каталоге сайтов) и формировании выборки (списка сайтов), которая в наибольшей степени отвечает характеру введенного вами запроса.

поисковая система

Главной характеристикой успешной работы системы является именно релевантность, то есть то, насколько соответствует список сайтов, которые вы видите на мониторе, тому запросу, который вы только что ввели. Поиск обычно ведется по ключевым словам. Например, по запросу «лодочные моторы» вы можете получить статьи о том, как правильно выбрать данный товар, сайты магазинов, где вы можете приобрести и другую соответствующую информацию.

Примечательно, что современные поисковые системы осуществляют операцию поиска не только сайтов, но и по документам в различных форматах, изображениях и аудиофайлам. Это очень удобно, поскольку если вам понадобится, к примеру, какая-либо музыкальная композиция, вы сможете найти ссылку для её скачивания с помощью поисковика.

Немного истории

Первый поисковый механизм появился относительно недавно – в 1990 году. Программа называлась Archie и осуществляла поиск в специальной базе по именам хранящейся в ней файлов. Настоящий прорыв в этой области произошел в 1994 году, когда появилась первая ПС, работающая с помощью робота, которая так и называлась Web-Crawler. Здесь можно было искать не по заголовкам файлов, но по любым словам на страницах. Именно так работают современные поисковики.

web-crawler

Понятие же поискового робота стало ключевым для всех систем, именно поэтому о нём стоит упомянуть отдельно. Данная программа автоматически посещает новые страницы и разделы веб-сайтов и заносит информацию о них в свою базу. Современные автоматизированные поисковики именно с его помощью оперативно обновляют информацию в своих каталогах.

Упоминание о большинстве первых ПС сегодня можно найти лишь в соответствующих разделах ИТ-энциклопедий. Из сегодняшних лидеров рынка давайте отметим дату появления Яндекс – 1997 год и Google, который был запущен в 1998.

Виды и характеристики

Первое, что отличает различные поисковики друг от друга, – это принцип их работы. Так существуют ПС:

  • Автоматизированные, для работы которых используется вышеупомянутый поисковый робот.
  • Управляемые вручную, когда информацию о новых сайтах в них заносит человек, составляя так называемый каталог ресурсов. Этот тип, широко распространённый ранее, постепенно сдаёт свои позиции – слишком быстро меняется сегодня интернет-среда, без помощи машин за её темпом просто не успеть.
  • Гибридные, совмещающие в себе характеристики первых двух типов. Здесь результаты работы робота проверяет человек. Это обеспечивает и высокую скорость обновления, и достаточно высокую точность выборки.
  • Мета-системы, которые сегодня сильно сдают свои позиции в следствии совершенствования первых трёх типов. В основе их работы лежит не создание собственной базы данных, а анализ и формирование выборки из данных сразу нескольких обычных поисковиков.

google паук

Поскольку поисковики собирают и ранжируют информацию, то и способы их взаимодействия с данными тоже могут сильно различаться. Основной единицей хранения и классификации бывает:

  • Факт, то есть информационная единица, содержащаяся в тексте сайта. Так работают фактографические системы. Чем это полезно конкретному пользователю, то есть Вам? Это самая мелкая из возможных структурных единиц текста, поэтому и точность выборки будет высока. Практически исключается ситуация, когда под релевантным вашему запросу заголовком скрывается совершенно бесполезное содержимое.
  • Другой тип систем – документальные – не осуществляет дробления текста на столь мелкие фрагменты. Его базовой структурной единицей, как видно из названия, является документ.
  • Геоинформационные ПС осуществляют привязку не только к содержимому сайта, но и к его местоположению.

геоинформационные системы

Кроме того, различают глобальные системы, которые анализируют все ресурсы, имеющиеся в мировой сети, а также локальные или региональные системы, ограничивающиеся рамками определённого региона. Иногда при этом учитываются даже культурные и религиозные традиции этой местности. Последнее верно, например, для региона Ближнего Востока. Местные поисковые системы осуществляют дополнительную фильтрацию ссылок, отсеивая нежелательное содержимое и исключая такие сайты из результатов поиска.

Цифры и факты

А какой поисковик предпочитаете Вы? Не нужно быть пророком, чтобы предсказать, что большинство читателей назовут всемирно признанный Google или безусловного лидера российского лидера – Яндекс. Пользуетесь чем-то другим? Тогда вас можно смело назвать пользователем с оригинальным вкусом. Для подтверждения приведу немного статистики.

рейтинг поисковых систем

Предпочтения пользователей в мире по данным на сентябрь 2015 года распределились следующим образом:
  1. Google – 69,24%. Несомненный лидер, ни одна другая ПС пока не может даже приблизится к этому результату. Единственный мировой лидер, пользующийся успехом и в России.
  2. Bing – 12,26%. Как видите, разрыв между первой и второй позицией огромен. В России эта ПС почти неизвестна (примерно 0,7% всех запросов в Рунете обрабатывается с её помощью).
  3. Yahoo! – 9,19%. В России его результат ещё скромнее, всего 0,2% поисковых запросов Рунета в месяц.

Другие зарубежные поисковики имеют ещё более скромные результаты.


А что же в России? Здесь лидирующие позиции у Яндекса, который выбирают чуть более 50% пользователей, Google у нас немного отстаёт – его предпочитают немногим более 40% пользователей. При этом многие пользователи используют каждый из этой победной двойки для решения конкретных задач. В частности, с помощью Google удобнее осуществлять поиск во всемирной паутине, если вас интересует именно глобальная выборка, если же нужны в первую очередь русские сайты, Yandex лучше справится с этой задачей.

Среди систем, ориентированных именно на русскоязычный сектор интернета (русские, украинские, белорусские сайты, другие страны СНГ), разрыв в показателях ещё выше, чем у зарубежных:

  1. Яндекс – 50%
  2. Mail – чуть больше 6%
  3. Рамблер – всего полпроцента.

(За данные спасибо Википедии).

Поисковики в деталях

В этом разделе более подробно поговорим о шестерке лидеров, определившихся в предыдущем разделе: Google, Bing, Yahoo, Яндекс, Mail и Рамблер. Несмотря на то, что некоторые из них лидерами можно назвать пока лишь условно, всё-таки у каждой есть свои поклонники.

google

Google появилась в 1998 году и с тех пор неуклонно наращивает свою аудиторию. В основу работы данной ПС был впервые положен механизм определения релевантности страницы по количеству данных на неё ссылок. Это была настоящая революция, которая и определила направление развития поисковых систем на ближайшие годы.

Сегодня о популярности этого поисковика наиболее красноречиво говорит факт официального включения во многие словари глагола to google (русский вариант – «гуглить»). Именно Гугл проиндексировано более 25 миллиардов страниц, что является абсолютным рекордом всемирной паутины. Территория охвата пользователей у неё также самая широкая ведь Google функционирует более чем на двух сотнях языков.

bing

Датой рождения Bing считается 1 июня 2009 года. Впрочем, если вы уже давно дрейфуете в необъятных пространствах Интернета вы могли быть знакомы с ней и ранее, поскольку возникла она на основе известной мета-системы MSN Search.  Её успеху способствовало несколько факторов, например, возможность получить все результаты поисковой выдачи по нужному вам запросу на одной странице. Если Вы, уважаемый читатель, часто ищете в Интернете, информацию в какой-либо крайне узкой сфере, то, наверное, провели довольно много времени, пролистывая страницы с результатами. На популярность Bing играет и возможность изменять объём информации по каждому из сайтов в выдаче в настройках.

yahoo!

Основным достоинством Yahoo!, появившегося ещё в далёком 1995, является ручное добавление сайтов в каталог, обеспечивающее высокую точность поисковой выдачи. Кроме того, в настройках можно выбрать поисковый механизм, с помощью которого будет осуществляться поиск (если найти информация с помощью Yahoo! не удалось, система выполнит повторный поиск на основе AltaVista в автоматическом режиме).

yandeх

Яндекс в данный момент не имеет конкурентов среди российских ПС. Как не сложно догадаться его доля мирового рынка также высока – он занимает 4-е место по популярности. Эта ПС начала работу в 1997 и, хотя на тот момент в России уже были свои поисковики, быстро обошла конкурентов. Несомненным преимуществом для русскоязычных пользователей является высокая морфологическая точность обработки запросов на русском языке с учётом всех его особенностей. Также поиск с помощью Yandex можно вести на украинском, белорусском, казахском и других языках.

Важной особенностью является и достаточно точное региональное ранжирование, что совсем немаловажно с учётом огромных размеров территории нашей страны. Если геолокация важна для вводимого пользователем запроса, то выборка будет составлена с максимальной точностью. Ведь, согласитесь, не слишком приятно, когда вы хотите, например, заказать пиццу в Челябинске, а попадаете на сайт пиццерии, расположенной в Перми? Для того чтобы получить точную выборку, необязательно указывать город в строке поиска, он будет определён системой автоматически. Конечно, другие поисковики также выполняют эту функцию, но именно Яндекс справляется с этой задачей наилучшим образом.

mailru

Вторая по распространённости среди российских ПС – Mail появилась в 1998 году. Сегодня данный ресурс представляет собой серию тематических порталов (Деньги, Работа, Здоровье, Авто, Дети и другие тематики). Соответственно, в поиске могут отображаться не только результаты поисковой выдачи, но и ссылки на соответствующие тематические статьи в нужном разделе самого Mail. Такую поисковую выборку принято называть интегрированной.

Rambler

Рамблер, появившийся в 1996 году, вплоть до 2001 года стабильно оставался в лидерах российского сегмента поисковиков. С 2011 года он официально прекратил своё функционирование как поисковая система и стал медийным интернет-порталом. В первую очередь для пользователя это означает максимальное удобство – новости и результаты поиска ранжируются с учётом недавней активности пользователя. Как Рамблеру удаётся настолько точно определить его интересы? Анализируются все сайты с установленным блоком контекстной рекламы Бегун, на которые недавно заходил пользователь. Поскольку Бегун является одним из наиболее распространённых сервисов, выборка для анализа получается значительной.

Если вы успешно добрались до конца данной статьи, то ваши знания об имеющихся поисковых системах несомненно расширились. Надеюсь, что вам было интересно. Не забудьте подписаться на обновления, чтобы не пропустить новые полезные материалы, и заходите почаще.

Спасибо за внимание! Пока-пока.

С уважением, Роман Чуешов


Прочитано: 50 раз
Этот блог уже читают
читай и ты!
Оставить коментарий
:p :-p 8) 8-) :lol: =( :( :-( :8 ;) ;-) :(( :o:
  • Денис

    Яндекс монополист безусловный. Возникнув как поисковик, Яндекс сейчас занимается деньгами, почтой, с недавнего времени появилась Яндекс-Такси.

    02.01.2017 в 00:52
  • Денис

    Поисковик Гугл релевантнее Яндекса, Яндекс чаще чушь разную по запросу выдаёт, но я пользуюсь по старинке Яндексом чаще, чем поиском от Гугл. Гуглом почти не пользуюсь.

    02.01.2017 в 01:03
    • Роман

      Я тоже больше яндекс предпочитаю.

      02.01.2017 в 11:15
  • Денис

    Чаще стал пользоваться поисковиком DDG! Его считают чуть не конкурентом самого Гугла. В ряде ОС DDG! установлен по умолчанию. Релевантность ответов на запросы у DDG! чуть выше Яндекса.

    02.01.2017 в 01:11
  • Денис

    DuckDuckGo! чем хорош, что он сайты не индексирует как Яндекс и Гугл, т.е. у него нет топ-10. Каждый раз при том же запросе в выдаче появляются новые сайты.

    02.01.2017 в 01:16
    • Роман

      Интересно.)))

      02.01.2017 в 11:16
    • Денис

      У DuckDuckGo! ввыдача не на страницАХ, как в Яндексе, а на одной странице. Дойдёшь до конца страницы, там кнопка Ещё, жмёшь, появляется новый вывод сайтов.

      02.01.2017 в 12:53
  • Денис

    Яндекс и Гугл — монополисты, и как монополисты начинают выходить за рамки и предъявлять повышенные требования к пользователям, начинают диктовать им свою волю. Я не всегда соответствую их требованиям, да и не собираюсь, потому что есть другие поисковики с нормальными требованиями.

    02.01.2017 в 01:27
    • Роман

      Денис, каким же ты пользуешься?

      02.01.2017 в 11:17
    • Денис

      Пользуюсь поисковиками по ситуации, когда Яндексом, когда DuckDuckGo!

      02.01.2017 в 12:55
  • Денис

    Ситуация странная, поисковики зависят от пользователей, а когда пользователи подсаживаются на поисковик, поисковик начинает диктовать им свои условия, никак не относящиеся к поиску.

    02.01.2017 в 01:31