Материал из РУВИКИ — свободной энциклопедии

Яндекс (поисковая система)

Яндекс.Поиск
Yandex icon.svg
Yandex Search RU wordmark.svg
Тип поисковая система
Разработчики «Яндекс»
Языки интерфейса многоязычный
Первый выпуск 1997
Последняя версия «Y1» (10 июня 2021 года)
Состояние Работает
Сайт yandex.com
Логотип РУВИКИ.Медиа Медиафайлы на РУВИКИ.Медиа

«Я́ндекс» — поисковая система, принадлежащая российской корпорации «Яндекс», основной продукт компании.

Доля «Яндекс.Поиска» составляет 56 % на рынке Рунета (июль 2019 года)[1] и 7 % на рынке Турции (по данным на октябрь 2015 года)[2].

Общие сведения[править | править код]

Поиск Яндекса позволяет искать документы на русском, татарском, украинском, белорусском, казахском, турецком, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.

С начала 2006 года по 2009 год поиск «Яндекса» был установлен на портале Mail.ru[3].

С 23 июня 2011 года поиск «Яндекса» установлен на портале Rambler[4].

В ноябре 2016 года Яндекс представил поисковый алгоритм «Палех», который ищет подходящие веб-страницы не по ключевым словам, а по смыслу. Алгоритм основан на нейронных сетях и предназначен для поиска ответов на редкие и уникальные запросы[5].

В конце августа 2017 года Яндекс представил новую версию поиска, в основе которой лежит поисковый алгоритм «Королёв». Он использует нейронную сеть, которая сопоставляет смысл запроса и веб-страницы. Благодаря этому поисковая система может точно отвечать на сложные запросы[6][7].

Охват форматов[править | править код]

Помимо традиционных веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (блоги и форумы).

Язык поисковых запросов[править | править код]

см. Язык запросов, используемый Yandex[8]

Яндекс на татарском языке

Результаты[править | править код]

По умолчанию Яндекс выводит до 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска[9] можно увеличить размер страницы до 20, 30 или 50 найденных документов. Иногда порядок сайтов на этих страницах может отличаться, так как обновление баз для этих результатов происходит не одновременно. Стоит учитывать и рекламу Рекламной Сети Яндекса в поисковой выдаче. Порой такая реклама содержит более семи объявлений, ведущих на разные сайты. Сами объявления располагаются над результатами поисковой выдачи, под ними и сбоку.

Если по запросу найдено очень много ссылок, страница результатов предлагает ограничить диапазон поиска — по региону (то есть по диапазону IP) или по дате. В 2012 году появилась ещё одна возможность — подсказки по цели запроса (интентный поиск)[10]. Кроме того, если по какому-либо слову или словам ничего не найдено, предлагается заменить его/их на похожие (поскольку предлагаемые варианты зависят от частоты нахождения похожих слов, иногда возникают забавные ситуации[11]). Также предлагается исправить слова, набранные не в той раскладке клавиатуры.

Интернет-компания Яндекс с 15 ноября 2018 года начала удалять ссылки на спорный контент из поисковой выдачи в рамках исполнения требований так называемого антипиратского меморандума, подписанного интернет-компаниями и правообладателями 1 ноября 2018 года. Ссылки исчезают из поисковой выдачи в течение шести часов после попадания в реестр. Компания также призывает остальных игроков индустрии поддержать эту инициативу[12].

В апреле 2021 года ФАС возбудила в отношении «Яндекса» дело по статье о злоупотреблении доминирующим положением, так как в поисковой выдаче компания отдавала предпочтение своим сервисам. Заявителями выступили российские интернет-компании, включая «Авито», «Циан» и «2ГИС». 19 января 2022 года «Яндекс» и ФАС объявили о мировом соглашении, в рамках которого «Яндекс» выплатит 1,5 миллиарда рублей Российскому фонду развития информационных технологий (РФРИТ), деньги используют «на продвижение российских программных ИТ-продуктов в сети Интернет». Деятельность РФРИТ, который входит в группу ВЭБ.РФ, курирует Министерство цифрового развития, связи и массовых коммуникаций[13].

Качество[править | править код]

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. По факту такие изменения далеко не всегда улучшают поисковую выдачу по запросам. Такие изменения, официально объявленные, происходили, например, в марте 2004 года[14], августе 2005 года[15] и январе 2007 года[16]; по неофициальным сведениям, их значительно больше (например, в августе-сентябре 2007 года[17]). Крупное изменение произошло в ноябре 2009 года, когда была выложена обновлённая версия поисковой программы «Снежинск»[18]. Последнее подобное изменение произошло в декабре 2010-го, когда Яндекс внедрил новую поисковую технологию «Спектр» (версия «Краснодар»)[19]. Она позволяет учитывать потребности пользователей, которые не были явно сформулированы в запросе. Например, по запросу [бетховен] пользователям покажут результаты и про биографию композитора, и его произведения, и фильм «Бетховен». В декабре 2012 года Яндекс представил новую поисковую платформу «Калининград», которая осуществляет персональный поиск с учётом личных интересов пользователя.

Сайты, которые «Яндекс» не индексирует или ограничивает ранжирование[20]:

  1. Копирующие или переписывающие информацию с других ресурсов и не создающие оригинального контента.
  2. Единственной целью которых является перенаправление пользователя на другой ресурс, автоматически (редирект) или добровольно.
  3. С автоматически сгенерированным (бессмысленным) текстом.
  4. С каталогами (статей, программ, предприятий и т. п.), если они являются только агрегаторами контента, не создают тексты и описания самостоятельно и не предоставляют никакой уникальной услуги.
  5. С невидимым или слабовидимым текстом или ссылками.
  6. Отдающие разный контент пользователям и роботам поисковых систем (клоакинг).
  7. Предоставляющие товары или информацию по партнёрским программам, но не представляющие никакой ценности для пользователя.
  8. Использующие обманные техники (например, вредоносный код, скрипты, настройки серверов), перенаправляющие пользователей на сторонние ресурсы или меняющие окно результатов поиска на страницы других ресурсов при переходе из поисковых систем.
  9. Содержащие списки поисковых запросов (многократное повторение и перечисление ключевых слов), предназначенные исключительно для обмана поисковой системы и манипулирования результатами её работы, в том числе использование элементов страниц, скрывающих ключевые слова, например, посредством скроллинга или других технических приёмов.
  10. Группы сайтов одного владельца/компании, предоставляющие пользователю одни и те же товары или услуги, созданные с целью заполнения нескольких позиций в результатах поиска и сбора трафика.
  11. Немодерируемые форумы, доски объявлений, содержащие большое количество ссылочного спама.
  12. Ставящие внешние ссылки исключительно для обмана поисковых систем и «накачивания» релевантности и не являющиеся рекомендацией автора посетить ресурс.
  13. Сайты или группы сайтов, интенсивно ссылающиеся друг на друга (линкфармы).
  14. Страницы сайта с результатами поиска.

С 2009 года на качество поиска также влияет фильтр АГС.

Со 2 февраля 2016 года компания Яндекс начала использовать новую формулу ранжирования, учитывающую пригодность сайта для мобильных устройств. Новую формулу назвали «Владивосток» — в честь одного из крупнейших дальневосточных городов[21]. Также в 2016 году в поиск была внедрена система «Палех», повышающая качество поиска для редких запросов. «Палех» основан на технологии искусственных нейронных сетей.

В марте 2019 года компанией Яндекс был запущен специальный инструмент, который помогает находить страницы сайтов с пиратским контентом[22].

Функциональность[править | править код]

Илья Сегалович представляет новый поисковый механизм «Яндекса» «Острова»

Основная информация[править | править код]

Поисковая машина состоит из трёх основных компонентов[23]:

  • Агент — это поисковый робот. Он обходит сеть, скачивает и анализирует документы. В случае обнаружения новой ссылки при анализе сайта она попадает в список веб-адресов робота. Поисковые роботы бывают следующих типов: пауки (англ. Spider) — загружают сайты подобно браузерам пользователя; «путешествующие» пауки (англ. Crawler) — обнаруживают новые, ещё неизвестные ссылки на основе анализа уже известных документов; индексаторы — занимаются анализом обнаруженных веб-страниц и добавляют данные в индекс. Множество выкачанных документов разбивается на непересекающиеся части и очищается от разметки.
  • Индекс — база данных, собранная роботами-индексаторами поисковых машин. По индексу и осуществляется поиск документов.
  • Поисковый механизм.

Поисковый запрос от пользователя после анализа загруженности поисковой системы отправляется на наименее загруженный сервер[24][25]. Для обеспечения такой возможности серверы «Яндекса» объединены в кластеры и даже кластеры кластеров. Затем пользовательский запрос обрабатывается программой под названием «Метапоиск». Метапоиск осуществляет анализ запроса в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также программа определяет, относится ли запрос к категории наиболее популярных или недавно заданных. Выдача на такие запросы некоторое время хранится в памяти (кэше) метапоиска, и в случае совпадения показываются заранее сохранённые результаты[25]. Если запрос является редким и совпадений в кэше не найдено, система перенаправляет его на программу «Базового поиска». Тот анализирует индекс системы, также разбитый по разным дублирующимся серверам (это ускоряет процедуру). Затем полученная информация снова попадает на метапоиск, данные ранжируются и показываются пользователю в готовом виде[24].

Индексирование[править | править код]

В целом «Яндекс» индексирует следующие типы файлов[26]: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.

Поисковая система способна также индексировать текст внутри объектов Shockwave Flash (если текст не помещён на само изображение), если эти элементы передаются отдельной страницей, имеющей MIME-тип application/x-shockwave-flash, и файлы с расширением .swf[27].

В «Яндексе» работают 2 сканирующих робота — «основной» и «быстрый». Первый отвечает за интернет в целом, второй индексирует сайты с часто меняющейся и обновляемой информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Orange», разработанную совместно калифорнийским и московским подразделениями «Яндекса»[27].

В логах сервера роботы «Яндекса» представляются следующим образом[27][28]:

  • Mozilla/5.0 (compatible; YandexBot/3.0) — основной индексирующий робот.
  • Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector) — робот, определяющий зеркала сайтов. Если найдутся несколько сайтов с одинаковым содержимым, в результатах поиска будет показан только один.
  • Mozilla/5.0 (compatible; YandexImages/3.0) — индексатор «Яндекс. Картинок».
  • Mozilla/5.0 (compatible; YandexVideo/3.0) — индексатор «Яндекс. Видео».
  • Mozilla/5.0 (compatible; YandexMedia/3.0) — робот, индексирующий мультимедийные данные.
  • Mozilla/5.0 (compatible; YandexBlogs/0.99; robot) — робот поиска по блогам, индексирующий комментарии постов.
  • Mozilla/5.0 (compatible; YandexAddurl/2.0) — робот, обращающийся к странице при добавлении её через форму «Добавить URL».
  • Mozilla/5.0 (compatible; YandexFavicons/1.0) — робот, индексирующий иконки сайтов (favicons).
  • Mozilla/5.0 (compatible; YandexDirect/3.0) — робот, индексирующий страницы сайтов, участвующих в «Рекламной сети „Яндекса“» (РСЯ).
  • Mozilla/5.0 (compatible; YandexDirect/2.0; Dyatel) — «простукивалка»[прояснить] «Яндекс. Директа».
  • Mozilla/5.0 (compatible; YandexMetrika/2.0) — робот «Яндекс. Метрики».
  • Mozilla/5.0 (compatible; YandexCatalog/3.0; Dyatel) — «простукивалка» «Яндекс. Каталога».
  • Mozilla/5.0 (compatible; YandexNews/3.0) — индексатор «Яндекс. Новостей».
  • Mozilla/5.0 (compatible; YandexAntivirus/2.0) — антивирусный робот «Яндекса».

С 2009 года «Яндекс» поддерживает технологию Sitemaps[27].

Поисковые запросы[править | править код]

Интерфейс «Яндекса» располагает довольно сложным языком запросов, позволяющим ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Для настройки используются следующие символы-джокеры[29]:

  • "" — точная цитата
  • | — ставится между словами, если нужно найти одно из них
  • * — ставится между словами, если между ними пропущено какое-то слово
  • site: — поиск на определённом сайте
  • date: — поиск документов по дате, например, date:2007
  • + — ставится перед словом, которое обязательно должно присутствовать в документе
  • - — ставится перед словом, которое не должно присутствовать в поисковой выдаче.
  • и др.

«Яндекс» автоматически, наряду с оригинальной «точной формой» запроса, ищет его различные вариации и формулировки[30].

Поиск «Яндекса» учитывает морфологию русского языка, поэтому вне зависимости от формы слова в поисковом запросе выдача будет производиться по всем словоформам. Если морфологический анализ нежелателен, можно перед словом поставить восклицательный знак (!) — поиск в этом случае покажет только конкретную форму слова. Кроме того, при поисковом запросе практически не учитываются так называемые стоп-слова, то есть предлоги, знаки препинания, местоимения и т. д., ввиду их большого распространения[23].

Как правило, автоматически раскрываются аббревиатуры, действует транслитерация (например, «Рено — Renault»), исправляется орфография. Также производится поиск по синонимам (мобильный — сотовый) и различным словоформам (Воронеж — воронежский). Расширение или нет исходного пользовательского запроса зависит от контекста. Расширение не происходит при наборе узкоспециальных терминов (к запросу «монтёрская кошка» не будет добавлено слово «кошачий»), имён собственных, названий компаний (к примеру, ОАО «Бегемот» — ОАО «Гиппопотам»), при добавлении слова «цена», в точных цитатах (это запросы, выделяемые машинописными кавычками)[30].


Защита от спама и вирусов[править | править код]

По состоянию на 2013 год «Яндекс» является самой безопасной поисковой машиной на планете и третьим по степени защищённости среди всех веб-ресурсов[31].

Проверка веб-страниц и предупреждение пользователей появились на «Яндексе» в 2009 году: с тех пор на странице результатов поиска рядом с опасным сайтом появляется пометка «Этот сайт может угрожать безопасности вашего компьютера»[32]. Для обнаружения угроз используются сразу две технологии. Первая куплена у американского антивируса «Sophos» и основана на сигнатурном подходе: то есть при обращении к веб-странице антивирусная система обращается к базе данных уже известных вирусов и вредоносных программ. Такой подход отличается высокой скоростью, но практически бессилен перед новыми вирусами, ещё не попавшими в базы данных. Поэтому «Яндекс» использует наряду с сигнатурным ещё и свой собственный антивирусный комплекс, основанный на анализе поведенческого фактора. Программа «Яндекса» при обращении к сайту проверяет, запрашивал ли последний у браузера дополнительные файлы, перенаправлял ли на посторонний ресурс и т. д. Таким образом, если получены данные, что сайт начинает выполнение неких действий (запускаются каскадные таблицы стилей, модули Java Script и полноценные программы) без ведома пользователя, он помещается в «чёрный список» и базу вирусных сигнатур[33]. Информация о заражении сайта появляется в результатах поиска, и через сервис «Яндекс.Вебмастер» соответствующее уведомление получает владелец сайта. После первой проверки «Яндекс» делает вторую, и если информация о заражении во второй раз подтвердится, проверки будут проходить чаще, пока угроза не будет устранена. Общее число заражённых сайтов в базе «Яндекса» не превышает 1 %[32].

Ежедневно в 2013 году «Яндекс» проверяет 23 млн веб-страниц (обнаруживая при этом 4300 опасных сайтов) и показывает пользователям 8 млн предупреждений[33]. Ежемесячно проверяется примерно миллиард сайтов[32].

Поисковая выдача и ранжирование[править | править код]

Поисковая выдача для каждого пользователя формируется индивидуально на основе его местоположения, языковых запросов, интересов и предпочтений по результатам предыдущих и текущей поисковой сессии[34]. Тем не менее, ключевым фактором при ранжировании поисковых результатов является их релевантность, соответствие поисковому запросу. Релевантность определяется на основе формулы ранжирования, которая постоянно обновляется на основе алгоритмов машинного обучения.

Долгое время ключевым фактором ранжирования у «Яндекса» было количество сторонних ссылок на конкретный сайт. Каждой странице в Интернете присваивался своеобразный индекс цитирования, аналогичный индексу для авторов научных статей: чем больше ссылок, тем лучше. Подобный механизм работал как в тИЦ «Яндекса», так и в PageRank поисковой системы Google. Тем не менее, в настоящий момент в целях предотвращения «накрутки» «Яндекс» применяет многофакторный анализ, из восьмисот факторов ранжирования которого на ссылочные приходится лишь 70. Сегодня гораздо бо́льшую роль играет содержание сайта и наличие-отсутствие там ключевых слов, удобство чтения текста, название домена и его история, наличие мультимедийного контента. 5 декабря 2013 года «Яндекс» объявил о полном отказе от учёта ссылочного фактора в будущем[35].

Поиск производится на русском, английском, французском, немецком, украинском, белорусском, татарском, казахском языках.


Результаты поиска можно отсортировать по релевантности и по дате (кнопки снизу поисковой выдачи).

Страница с результатами поиска состоит из 10 ссылок с короткими аннотациями — «сниппетами». Последний включают в себя текстовый комментарий, ссылку, адрес, популярные разделы сайта, страницы в соцсетях и пр.[36] В качестве альтернативы сниппетам «Яндекс» ввёл в 2014 году новый интерфейс под названием «Острова»[37].

В «Яндексе» реализован механизм «параллельных поисков», когда вместе поиском по вебу производится поиск по сервисам «Яндекса», таким, как Каталог, Новости, Маркет, Энциклопедии, Картинки и др. В результате в ответ на запрос пользователя система выдаёт не только текстовую информацию, но и ссылки на видеофайлы, картинки, словарные статьи и пр.[38].

Отличительной особенностью поисковика являются также технологии «интентного поиска» (от англ. intent — намерение, желание), то есть поиска, нацеленного на решение задачи[39]. Среди элементов такого поиска — наличие диалоговых подсказок при неоднозначном запросе, автоматический перевод текста, показ информации о характеристиках автомобиля и т. д. Для примера, при запросе «Борис Гребенщиков — Город золотой» система покажет форму для онлайн-прослушивания музыки из сервиса «Яндекс.Музыка», при запросе «ул. Королёва,12» будет показан фрагмент карты с отмеченным на ней объектом.

Информационные блоки между строкой запроса и результатами называются «колдунщиками». Полный их список:

Поисковые подсказки[править | править код]

По мере набора пользователем запроса в строке поиска поисковая машина предлагает подсказки в виде ниспадающего списка. Подсказки появляются ещё до перехода на страницу результатов поиска и позволяют уточнить запрос, исправить раскладку или опечатку или перейти сразу на искомый сайт. Для каждого пользователя подсказки формируются в том числе на истории его поисковых запросов (сервис «Мои находки»). В 2012 году появились так называемые «Умные поисковые подсказки», которые моментально выдают информацию об основных константах (длина экватора, скорость света и так далее), пробках на дорогах, и имеют встроенный калькулятор. Кроме того, в «подсказки» встроен переводчик (запрос «любовь по-французски» моментально выдаёт amour, affection), расписание и результаты футбольных матчей, курсы валют, прогноз погоды и другое. Можно узнать точное время запросом «который час». В 2011 году подсказки в поиске «Яндекса» стали полностью локальными для 83 регионов России.

Помимо собственно поиска, подсказки встроены в собственные поисковики «Яндекс. Словарей», «Яндекс. Маркета», «Яндекс. Карт» и других сервисов «Яндекса».

Функция является развитием технологии интентного поиска и впервые появился на «Яндекс.Баре» в августе 2007 года, а в октябре 2008 был внедрён на главной странице поисковика[40]. Доступен как в настольной, так и в мобильной версии сайта. «Яндекс» показывает своим пользователям более миллиарда поисковых подсказок в день[41].

Другое[править | править код]

Первоначальный логотип поисковика.

«Яндекс» предлагает ещё несколько видов поиска:

  • Дзен-Поиск — «медитативный поиск» «Яндекса». На данный момент закрыт, а по ссылке dzen.yandex.ru идёт перенаправление на Яндекс.Дзен
  • Расширенный поиск — позволяет ограничивать поисковую выдачу географией, языком, отдельным сайтом, расширением документов, последним обновлением, количеством результатов на странице.
  • Семейный поиск — поиск безопасного для детей содержимого.
  • Поиск для слабовидящих

Летом 2017 года в рамках совместного проекта Банка России и компании Яндекс в поисковой выдаче системы Яндекс появился специальный «маркер» (зелёный кружок с галочкой и надписью «Реестр ЦБ РФ»), информирующий потребителя о том, что на промаркированном сайте предлагаются финансовые услуги компании, которая имеет статус микрофинансовой организации.[42][43][44]

Логотип «Яндекса»[править | править код]

Логотип «Яндекса» может менять свой дизайн в честь некоторых памятных дат, к примеру, 75-летию Владимира Высоцкого был посвящён музыкальный логотип[45].

История[править | править код]

Историю поиска «Яндекса» можно условно разделить на три этапа. До 2005 года поисковые технологии «Яндекса» были эффективными, но достаточно простыми: можно было создать сайт, состоящий из сотен страниц, на которых нет ничего, кроме ключевых слов, и «Яндекс» такой сайт нормально ранжировал. Начиная примерно с 2005 года в Рунете активизировался поисковый спам, и вскоре стало очевидно, что он является реальной угрозой бизнесу компании, могущей за короткий срок свести популярность поискового сервиса на нет. Это привело к тому, что в «Яндексе» всерьёз задумались об улучшении технологий поиска, вложили в это направление много ресурсов. Наконец, с осени 2007 года «Яндекс» уделяет много внимания качеству поиска и проводит научные разработки в области поисковых технологий.[источник не указан 3765 дней]

Изменения в поисковой машине долгое время широко не афишировались и оставались безымянными. И лишь с начала 2008 года, когда было объявлено о запуске алгоритма 8 SP1, «Яндекс» заявил о том, что впредь новые алгоритмы ранжирования будут носить названия городов[46].

1990-е[править | править код]

Дизайн «Яндекса» в декабре 1998 года.

Поисковая система yandex.ru была анонсирована компанией CompTek 23 сентября 1997 года[47] на выставке Softool, хотя отдельные разработки в области поиска (индексация Библии, поиск документов на CD-ROM, поиск по сайту) проводились компанией ещё раньше.

Название системы — «Яндекс», «Яndex», — придумали вместе Аркадий Волож и Илья Сегалович[48].

Слово расшифровывалось как yet another indexer («ещё один индексатор; очередной индексатор») или как «Языковой Индекс». По предложению Артемия Лебедева, если «I» перевести на русский, получится «Я». Чуть позже, после выхода «Яндекса» в Интернет, пользователи предложили свой вариант: «Иньдекс» — это же женское что-то такое, а «Яньдекс» — это такое сильное, муж­ское, то есть тот же индекс, но с мужским началом![49][48].

Первый индекс содержал информацию по 5 тыс. серверов и занимал 4,5 ГБ[50].

В том же 1997 году поиск «Яндекса» стал использоваться в русскоязычной версии Internet Explorer 4.0[51]. Стало возможным задавать запрос на естественном языке[52].

В 1998 году появилась функция «найти похожие документы» для каждого результата поиска[53].

«Яндекс. Поиск» по состоянию на 1998 год работал на трёх машинах, работавших на FreeBSD под Apache: одна машина обходила Интернет и индексировала документы, одна машина поисковая и одна машина дублировала поисковую машину[54].

В 1999 году появился поиск в категориях — поиск, сочетание поисковой системы и каталога[55]. Обновлена версия поисковой машины[56].

2000[править | править код]

6 июня 2000 года была представлена вторая версия поисковика[57].

Был внедрён механизм параллельного поиска, когда наряду с выдачей из веба предлагается информация из крупных источников. Пользователи получили возможность ограничить поисковую выдачу выбранной темой. Появилась рубрика «Популярные находки» — слова, уточняющие поиск[58].

К декабрю 2000 года объём проиндексированной информации достиг 355,22 Гб[59].

2001[править | править код]

2001 год стал для «Яндекса» значимым, поскольку тогда он обогнал другой российский поисковик, «Рамблер», по посещаемости и с тех пор является ведущей поисковой системой Рунета[60].

«Яндекс» стал понимать запросы на естественном языке, заданные в вопросительной форме. Система научилась распознавать опечатки и предлагать исправлять их. Изменился дизайн[61].

2002[править | править код]

Количество ежедневных запросов к поисковой машине «Яндекс» превысило 2 млн[62].

2003[править | править код]

Запущена индексация документов .rtf и .pdf[63]

Результаты поиска стали выдаваться в том числе и в формате XML[64].

2004[править | править код]

Изменился алгоритм ранжирования[65].

Стартовала индексация документов в формате .swf («флэш»)[66], .xls и .ppt[67].

В конце года было выложено в открытый доступ исследование «Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс» (авторы Илья Сегалович, Михаил Маслов), раскрывшее отдельные детали ранжирования в поисковике[68].

2005[править | править код]

Летом был запущен так называемый «быстрый» поисковый робот, работающий параллельно с основным и предназначенных для индексации актуальных страниц. База «быстрого робота» обновляется каждые 1,5—2 часа[69].

Был усовершенствован алгоритм ранжирования для увеличения точности поиска[70].

Возможности поиска были расширены с помощью сервисов «Яндекс. Словари» и «Яндекс. Lingvo». Поисковик научился понимать запросы типа «как [что-то] по-испански» и автоматически переводить их.

Стало возможным ограничить поисковую выдачу по региону[71].

2006[править | править код]

С мая 2006 в результатах поиска стали отображаться пиктограммы сайтов[72].

В начале декабря рядом с каждой ссылкой в выдаче появился пункт «Сохранённая копия», кликнув по которой, пользователь переходит на полную копию страницы в отдельной архивной базе («Яндекс-кэш»)[73].

Появилась геоклассификация сайтов[74].

2007[править | править код]

Был изменён алгоритм ранжирования[75].

с 2008 года[править | править код]

В 2008 году компания «Яндекс» впервые стала открыто объявлять об изменениях в поисковом алгоритме и давать им имена:

Чтобы изменения не дезориентировали пользователей, Яндекс с лета прошлого года начал их анонсировать. Загвоздка в том, как эти изменения называть, ведь к дате привязываться неудобно. Решили давать новым программам названия российских городов.[76]

Название «города» каждого следующего алгоритма начинается на ту букву, на которую оканчивалось название предыдущего[77].

2017[править | править код]

В сентябре 2017 года «Яндекс» отметил свой 20 день рождения. По этому случаю в офис «Яндекса» приехал Президент РФ В. В. Путин.

Значение «Яндекса»[править | править код]

Состояние, когда местные поисковые компании не уступают американским брендам, является в мире почти уникальным, если не учитывать опыт Китая, где Google в 2010 году был заблокирован, взламываются почтовые ящики правозащитников, а местные провайдеры часто перенаправляют адрес www.google.cn на сайт Baidu[60][113]. Россия является единственной страной в мире, за исключением США, которой удалось без протекционистских мер создать более одной успешной поисковой технологии с заметной долей рынка (см. также «Рамблер»)[114].

По словам медиа-эксперта Михаила Гуревича, «Яндекс» — «национальное достояние», «стратегический продукт»[115].

Данный факт осознали и в Государственной Думе Российской Федерации, где в мае 2012 года появился законопроект, в котором «Яндекс» и «ВКонтакте» признаются стратегическими предприятиями как общенациональные трансляторы информации[116]. Ещё в 2009 году Президент России Дмитрий Медведев инициировал покупку «Сбербанком» «золотой акции» «Яндекса» с целью избежать попадания предприятия общегосударственной важности в руки иностранцев[117].

В 2012 году «Яндекс» обогнал «Первый канал» по численности ежедневной аудитории, что сделало российский интернет-гигант лидером отечественного медиарынка[116]. В 2013 году «Яндекс» подтвердил этот статус, обогнав «Первый» по выручке[118].

В 2008 году «Яндекс» был девятым поисковиком в мире[119], в 2009 — седьмым[120], в 2013 — четвёртым[121].

Одной из составляющих такого положения служит наличие в России достаточного количества математически подкованных специалистов, обладающих научным чутьём[122][123]. Имеет значение языково-культурный барьер[48].

Россия — одна из немногих стран, у которых есть собственный поисковик, занимающий первое место в стране, есть свои соцсети, держащие первенство. […] В ближайшие 3—5 лет иностранцы смогут претендовать только на третье-четвёртое места[124].

К 2002 году слово «Яndex» стало настолько общеупотребительным, что, когда компания Аркадия Воложа потребовала вернуть ей домен yandex.com, выкупленный третьими лицами, ответчик заявил, что слово «Яндекс» является уже синонимом справочника и стало нарицательным[125].

С осени 2012 года поисковая система «Яндекс» обогнала по числу пользователей Google на браузере Google Chrome в России.[126][127][128].

Прочие поисковые услуги[править | править код]

  • Помимо собственно веб-поиска, компания «Яндекс» ищет по картинкам, блогам, видео, картам, новостям, персоналиям, товарам и т. д.
  • В течение некоторого времени «Яндекс» предлагал программу «Персональный поиск» для локального поиска на ПК пользователя.

Примечания[править | править код]

Комментарии
Источники
  1. статистика сайта "Сайты Рунета". www.liveinternet.ru. Дата обращения: 11 декабря 2018.
  2. «Яндекс» увеличил долю в Турции до 7% за счёт контракта с футболистами «Фенербахче». vc.ru (27 октября 2015). Дата обращения: 11 декабря 2018.
  3. Компания Яндекс — Главные новости — Mail.Ru и Яндекс договорились о стратегическом партнерстве, Компания Яндекс. Архивировано 9 августа 2017 года. Дата обращения: 14 июля 2017.
  4. Компании Рамблер и «Яндекс» заключили соглашение, согласно которому Рамблер начинает использовать на своих службах поисковые технологии Яндекса и присоединяется к Рекламной сети Яндекса (РСЯ). Дата обращения: 21 ноября 2011. Архивировано из оригинала 27 ноября 2011 года.
  5. Мамчуева, Оксана. Яндекс запустил новый поисковый алгоритм «Палех», Searchengines.ru (2 ноября 2016). Архивировано 19 марта 2017 года. Дата обращения: 20 сентября 2017.
  6. Яндекс представил новую версию поиска, Компания Яндекс. Архивировано 21 сентября 2017 года. Дата обращения: 20 сентября 2017.
  7. «Яндекс» представил новый поисковый алгоритм на основе нейронных сетей, Интерфакс (22 августа 2017). Архивировано 24 сентября 2017 года. Дата обращения: 23 сентября 2017.
  8. Язык запросов, используемый Yandex Архивная копия от 8 апреля 2020 на Wayback Machine
  9. Настройка результатов поиска. www.yandex.ru. Дата обращения: 14 июля 2017. Архивировано 15 сентября 2002 года.
  10. Интентный поиск: от ответов на вопросы к решению задач — Блог Яндекса. clubs.ya.ru. Дата обращения: 14 июля 2017. Архивировано 4 января 2013 года.
  11. опечатка? возможно, имелось в виду: «афтар» — Блог Яндекса — я.ру. Дата обращения: 22 февраля 2007. Архивировано 3 февраля 2007 года.
  12. «Яндекс» начал удалять из поисковой выдачи ссылки на пиратский контент. Дата обращения: 16 ноября 2018. Архивировано 16 ноября 2018 года.
  13. "Яндекс" заключил с ФАС мировое соглашение. Российская газета. Дата обращения: 21 января 2022. Архивировано 20 января 2022 года.
  14. Анастасия Тойшина. Я СПРОСИЛ У «ЯНДЕКСА»: «ГДЕ МОЯ ЛЮБИМАЯ?» Яндекс (22 апреля 2004). Дата обращения: 16 марта 2014. Архивировано 14 ноября 2007 года.
  15. А у нас новое ранжирование результатов поиска — Блог Яндекса — я.ру. Дата обращения: 22 февраля 2007. Архивировано 13 мая 2007 года.
  16. Новый алгоритм Яндекса — Mastertalk. mastertalk.ru. Дата обращения: 14 июля 2017. Архивировано 4 января 2012 года.
  17. Что наша жизнь? Родео! — Форум об интернет-маркетинге. Searchengines.guru. Дата обращения: 14 июля 2017. Архивировано 6 мая 2014 года.
  18. Снежинск на www.yandex.ru — Блог Яндекса для вебмастеров. webmaster.ya.ru. Дата обращения: 14 июля 2017. (недоступная ссылка)
  19. Технология «Спектр», Компания Яндекс. Архивировано 10 декабря 2011 года. Дата обращения: 14 июля 2017.
  20. Какие сайты «Яндекс» не индексирует или ограничивает ранжирование // Газета «Коммерсантъ». — 2010-08-26. — Вып. 156. — С. 10. Архивировано 30 августа 2010 года.
  21. Яндекс: мобильные сайты получат преимущества при ранжировании. ООО «ИнфоСистем» (19 февраля 2016). Дата обращения: 24 марта 2016. Архивировано 3 апреля 2016 года.
  22. «Яндекс» запускает инструмент по поиску пиратского контента. Дата обращения: 15 марта 2019. Архивировано 18 января 2021 года.
  23. 1 2 Абрамзон Михаил. Яндекс для всех. — СПб.: БХВ-Петербург, 2007. — 544 с. — ISBN 978-5-9775-0144-6.
  24. 1 2 Технологии Яндекса. tech.yandex.ru. Дата обращения: 11 декабря 2018.
  25. 1 2 Архитектура ответа на вопрос. Компания Яндекс. Дата обращения: 11 декабря 2018.
  26. По данным страницы «Расширенного поиска»
  27. 1 2 3 4 Поисковая система Яндекс (копия Архивная копия от 27 октября 2018 на Wayback Machine)
  28. Помощь вебмастеру - Вебмастер. Помощь. yandex.ru. Дата обращения: 11 декабря 2018.
  29. Частые вопросы в Яндекс.Поиске. Поиск. Помощь. Дата обращения: 11 декабря 2018.
  30. 1 2 Искусство понимать с полуслова. Расширение запроса в Яндексе. habr.com. Дата обращения: 11 декабря 2018.
  31. Американские эксперты: Google в шесть раз опаснее, чем «Яндекс». CNews.ru. Дата обращения: 11 декабря 2018.
  32. 1 2 3 Антивирусные технологии. Компания Яндекс. Дата обращения: 11 декабря 2018.
  33. 1 2 Безопасность в интернете: вирусы. www.comss.info. Дата обращения: 11 декабря 2018.
  34. 1 2 Персональный поиск. Компания Яндекс. Дата обращения: 11 декабря 2018.
  35. Не на кого сослаться. Lenta.ru (11 декабря 2013). Дата обращения: 11 декабря 2018.
  36. «Острова» Яндекса: техническая сторона и API. habr.com. Дата обращения: 11 декабря 2018.
  37. Высадка на острова. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  38. Что вы знаете про параллельные поиски? Блог Яндекса. Дата обращения: 11 декабря 2018.
  39. 1 2 Яндекс дает персональный ответ. Компания Яндекс (12 декабря 2012). Дата обращения: 11 декабря 2018.
  40. Яндекс понимает пользователя с полуслова. Компания Яндекс (15 октября 2008). Дата обращения: 11 декабря 2018.
  41. Поисковые подсказки. Компания Яндекс. Дата обращения: 11 декабря 2018.
  42. Событие. Банк России. Дата обращения: 28 июня 2017.
  43. «Яндекс» начал маркировать микрофинансовые организации в рамках проекта ЦБ, Рамблер (28 июня 2017). Дата обращения: 28 июня 2017.
  44. Центробанк начал маркировать в Интернете легальные МФО, Банки.ру. Дата обращения: 28 июня 2017.
  45. «Яндекс» посвятил Высоцкому музыкальный логотип. Lenta.ru (25 января 2013). Дата обращения: 11 декабря 2018.
  46. Эволюция поисковых алгоритмов «Яндекса» (копия копия Архивная копия от 18 ноября 2018 на Wayback Machine)
  47. История. Компания Яндекс. Дата обращения: 11 декабря 2018.
  48. 1 2 3 Аналитическая программа «Рунетология» // Сооснователь и директор по технологиям и разработке компании «Яндекс» Илья Сегалович (Текст (копия Архивировано 20 июля 2017 года.))
  49. Архивная копия журнала №10/2012 (стр. 76). Wayback machine. Computer Bild (25 августа 2012).
  50. Яндекс: прошлое, настоящее, будущее... all-forum.ru. Дата обращения: 11 декабря 2018.
  51. Yandex.ru становится стандартным средством поиска в русскоязычной версии Internet Explorer 4.0. Дата обращения: 3 марта 2013. Архивировано из оригинала 9 сентября 2011 года.
  52. Новое лицо yandex.ru. Естественно-языковый запрос. Компания Яндекс (18 ноября 1997). Дата обращения: 11 декабря 2018.
  53. Портрет от yandex.ru. Поиск "по аналогии". Компания Яндекс (14 января 1998). Дата обращения: 11 декабря 2018.
  54. Как раскрутить проект в Интернете. Реклама в Интернет на примере рекламных возможностей поисковой машины Яndex.ru. citforum.ru. Дата обращения: 11 декабря 2018.
  55. Yandex.Ru - теперь категорически! Компания Яндекс (2 августа 1999). Дата обращения: 11 декабря 2018.
  56. Star Wars. Новый Яndex — Борьба с хаосом. Дата обращения: 3 марта 2013. Архивировано из оригинала 30 июня 2011 года.
  57. Три поисковика Рунета, не считая Google. Дата обращения: 3 марта 2013. Архивировано из оригинала 7 апреля 2014 года.
  58. Yandex - новая версия поисковой машины. Компания Яндекс (6 июня 2000). Дата обращения: 11 декабря 2018.
  59. Yandex в 2000 году Архивная копия от 28 марта 2014 на Wayback Machine (копия Архивная копия от 28 марта 2014 на Wayback Machine)
  60. 1 2 Бороться и искать (англ.). Forbes.ru (3 апреля 2008). Дата обращения: 11 декабря 2018.
  61. Новый поиск Яндекса. Точность - вежливость королей. Компания Яндекс (23 мая 2001). Дата обращения: 11 декабря 2018.
  62. Количество ежедневных запросов к поисковой машине Яндекс превысило 2 миллиона. Компания Яндекс (12 апреля 2002). Дата обращения: 11 декабря 2018.
  63. Яндекс копает глубже. Компания Яндекс (20 февраля 2003). Дата обращения: 11 декабря 2018.
  64. Яндекс предоставляет результаты поиска в формате XML. Компания Яндекс (13 ноября 2003). Дата обращения: 11 декабря 2018.
  65. Новый алгоритм ранжирования. Компания Яндекс (26 марта 2004). Дата обращения: 11 декабря 2018.
  66. Яндекс индексирует Flash. Компания Яндекс (29 сентября 2004). Дата обращения: 11 декабря 2018.
  67. Яндекс индексирует XLS и PPT. Компания Яндекс (16 декабря 2004). Дата обращения: 11 декабря 2018.
  68. Yandex ludens. Библиотека I2R. Дата обращения: 11 декабря 2018.
  69. Теперь мы индексируем быстрее! Блог Яндекса. Дата обращения: 11 декабря 2018.
  70. А у нас новое ранжирование результатов поиска. Блог Яндекса. Дата обращения: 11 декабря 2018.
  71. Регионы на расширенном поиске. Блог Яндекса. Дата обращения: 11 декабря 2018.
  72. Вот мы взяли краски в руки! Блог Яндекса. Дата обращения: 11 декабря 2018.
  73. Смотрите найденные слова в сохраненной копии. Блог Яндекса. Дата обращения: 11 декабря 2018.
  74. 1 2 Арзамас-2. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  75. 1 2 Что случилось 20 декабря? Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  76. 1 2 Позови меня тихо по имени... Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  77. С начала года зарплата региональных чиновников в стране выросла на 12,8%. 39.ru. Дата обращения: 11 декабря 2018.
  78. Изменения в алгоритме ранжирования «Яндекса»
  79. Подлетая к "Магадану". Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  80. Расширение запросов
  81. «Яндекс» для вебмастеров — «Магадан»
  82. "Магадан". Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  83. Прюнинг. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  84. Магадан 2.0. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  85. Находка. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  86. Арзамас. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  87. Тестируйте Арзамас 1.1: новая формула для России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  88. Тестируйте Арзамас 1.2 c новым классификатором гео-зависимости запросов. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  89. Арзамас 1.2 c новым классификатором -- на www.yandex.ru. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  90. Тестируйте Арзамас+16. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  91. Арзамас 1.5 -- тестируйте новую общую формулу. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  92. Тестируйте Арзамас 1.5 SP1 -- улучшенную региональную формулу. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  93. Снежинск на www.yandex.ru. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  94. Машинное обучение улучшило «Яндекс». www.nnre.ru. Дата обращения: 11 декабря 2018.
  95. 1 2 АГС-30. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  96. Поиск Яндекса в каждом городе. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  97. Яндекс для Беларуси. Компания Яндекс (14 апреля 2010). Дата обращения: 11 декабря 2018.
  98. Яндекс ищет по мировому интернету. Компания Яндекс (19 мая 2010). Дата обращения: 11 декабря 2018.
  99. Поиск Яндекса в каждом регионе Украины. Компания Яндекс (27 июля 2010). Дата обращения: 11 декабря 2018.
  100. Yandex.ru для Республики Татарстан. Компания Яндекс (30 июня 2010). Дата обращения: 11 декабря 2018.
  101. Тестируйте «Обнинск» — новое ранжирование для гео-независимых запросов в России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  102. «Обнинск» — новое ранжирование для гео-независимых запросов в России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  103. Поиск Яндекса угадывает желания. Компания Яндекс (15 декабря 2010). Дата обращения: 11 декабря 2018.
  104. Рейкьявик — новая поисковая платформа Яндекса. Компания Яндекс (17 августа 2011). Дата обращения: 11 декабря 2018.
  105. «Острова»: интерактивные ответы в результатах поиска. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  106. Новый персональный поиск Яндекса. Компания Яндекс (30 мая 2013). Дата обращения: 11 декабря 2018.
  107. АГС-40. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  108. Новый этап в борьбе со ссылочным спамом. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  109. Как важно быть мобильным. Блог Яндекса. Дата обращения: 11 декабря 2018.
  110. Алгоритм «Палех»: как нейронные сети помогают поиску Яндекса. Блог Яндекса. Дата обращения: 11 декабря 2018.
  111. Баден-Баден - новый алгоритм определения переоптимизированных текстов. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  112. Поиск, который мы делаем вместе. Блог Яндекса (22 августа 2017). Дата обращения: 22 августа 2017.
  113. В Китае заблокированы поисковые сервисы Google. habr.com. Дата обращения: 11 декабря 2018.
  114. «Яндекс» попрощался с «Рамблером». www.sfors.ru. Дата обращения: 11 декабря 2018.
  115. Интервью / Яндекс вышел на 4-е место среди глобальных поисковиков Россия вошла в ТОР-5 по венчурному финансированию Никита Белых стал самым читаемым в интернете губернатором / Михаил Гуревич, Григорий Бакунов. Эхо Москвы. Дата обращения: 11 декабря 2018.
  116. 1 2 «Яндекс» и «ВКонтакте» признают стратегическими предприятиями. При чём тут стартапы?
  117. Все нашёл. Коммерсантъ (3 декабря 2012). Дата обращения: 11 декабря 2018.
  118. «Яндекс» — крупнейшее медиа страны в этом году
  119. «Яндекс» — девятый поисковик мира. habr.com. Дата обращения: 11 декабря 2018.
  120. Яндекс – седьмой поисковик в мире. Searchengines.ru (1 апреля 2011). Дата обращения: 11 декабря 2018.
  121. «Яндекс» обогнал Microsoft по числу поисковых запросов. Ведомости (7 февраля 2013). Дата обращения: 11 декабря 2018.
  122. Руководитель Google Россия Владимир Долгов/ Аналитическая программа «Рунетология». PodFM.ru. — «В. ДОЛГОВ: Что значит повезло? России не повезло, что в ней появился „Яндекс“, потому что Россия — это страна, в которой есть достаточно хорошие специалисты, особенно в области разработки программного обеспечения. То, что в России появился „Яндекс“ — это следствие той системы образования, которая была в стране, и надеюсь, есть до сих пор.» Дата обращения: 11 декабря 2018.
  123. Почему на интернет-рынке России доминируют локальные компании? SearchEngines.ru (21 мая 2012). Дата обращения: 3 марта 2013. Архивировано из оригинала 15 сентября 2012 года.
  124. Не Facebook`ом единым...: Голос России (21 июля 2011). Дата обращения: 3 марта 2013. Архивировано 15 сентября 2012 года.
  125. Что нашлось у «Яндекса». Коммерсантъ (20 января 2003). Дата обращения: 11 декабря 2018.
  126. Пользователи Google Chrome выбирают Яндекс. megaseo.ru. Дата обращения: 11 декабря 2018.
  127. «Яндекс» обогнал Google внутри браузера Chrome. Дата обращения: 3 марта 2013. Архивировано из оригинала 23 мая 2013 года.
  128. "Яндекс" вписался в браузер конкурента. Ведомости (12 апреля 2013). — «Впрочем, даже среди пользователей Chrome самым популярным поисковиком уже несколько месяцев является „Яндекс“: на неделе, завершившейся 7 апреля, он обработал 52,9 % всех поисковых запросов внутри Chrome». Дата обращения: 11 декабря 2018.

Литература[править | править код]

Ссылки[править | править код]

Статьи и интервью