Настройка поиска в яндексе

Точный поиск

Как правило, когда мы вбиваем какую-то фразу, то это не значит, что мы найдем полное сочетание всех ваших слов в результатах поиска. Например, я хочу найти запрос «Как приготовить пельмени из курицы». В результатах нет точного вхождения на первых позициях сайта. Есть пельмени из куриного фарша, но мы искали конкретно из курицы. Ну это я так, для примера).

А теперь попробуйте ввести тот же самый запрос, но в кавычках. Смотрите, теперь самые первые запросы будут иметь точную последовательность слов, которую вы задали. Никакого фарша. Теперь всё точно так, как мы и рассчитывали.

Т.е. для точного нахождения заключайте текст запроса в кавычки.

Способы проверки

Узнать, что ищет в сети потенциальный пользователь вашего будущего проекта можно как вручную, так и с помощью специализированных сервисов, предоставляемых самим Яндексом.

Wordstat

Одним из них является Wordstat — сервис для сбора семантического ядра для коммерческих веб-сайтов. Здесь можно наглядно увидеть, что наиболее часто предпочитали искать люди в Яндексе за конкретный период времени. Пользоваться сервисом очень просто:

  1. Откройте главную страницу “Вордстата”: https://wordstat.yandex.ru/
  2. В поисковой строке введите слово или фразу по интересующей вас тематике.
  3. Нажмите кнопку “Подобрать”.

Отобразятся две колонки: в левой — на первой строке искомое слово или словосочетание и количество запросов с ним за последний месяц, а ниже другие фразы с этим словом, включая склонения, в правой — запросы, схожие по тематике.

Сервис позволяет в наглядных цифрах оценить, сколько посетителей стоит ожидать на сайте при выводе его на первую страницу выдачи Yandex.

К примеру ключ яндекс диск нужно прописать как «!яндекс диск»

Основное удобство Wordstat в том, что можно посмотреть популярность как простых ключевых запросов, так и сложных, включающих интересующее слово.

В настройках можно указать конкретный регион или оставить значение “Все регионы”, чтобы анализировать поисковую активность пользователей по всей России.

Пункт “История запросов” отображает частоту использования ключевых фраз за различные периоды, как списком, так и виде удобного графика.

Поисковая строка Yandex

Это самый простой способ выяснить интересы пользователей главного российского поисковика. Достаточно открыть главную страницу и начать вводить слово или фразу в поисковой строке — выпадающие подсказки “выдадут” наиболее популярные запросы сейчас.

Это можно сделать, кликнув по имени населенного пункта в верхнем левом углу на главной странице сайта или нажав на надпись “Настройка” в верхнем правом, и выбрав пункт “Изменить город”.

Яндекс.Исследования

“Исследования” — сервис Яндекса по накоплению самых разных данных, собираемых при использовании услуг компании и лежащих в открытом доступе.

На его главной странице: https://yandex.ru/company/researches в поле “Все темы” необходимо выбрать пункт “Поиск” и желаемый регион, либо оставить все. Загрузится список исследований, среди которых достаточно выбрать желаемое, по интересующей вас тематике.

Исследования Яндекса позволяют узнать, как люди ищут песню по нескольким словам или умудряются находить фильм, вводя в поиск фразу, кратко описывающую сюжет картины.

Здесь также представлены наиболее популярные запросы за последний год и другие интересные данные, которые помогут сориентироваться, в какой нише имеет смысл развивать проект. Вся информация представлена в удобном графическом формате.

Как исключить любое слово из поиска

Также очень часто при выдаче результатов поиска, нам выдается совсем не то, что мы бы хотели. Например я хочу найти информацию про английскую писательницу Агату Кристи, но введя этот запрос, у меня в основном вылезает информация об одноименной рок-группе. Что же в таком случае делать?

В этом случае нам после нашего запроса нужно будет написать те стоп-слова, которые не должны учитываться при поиске. Для этого перед каждым стоп-словом нам нужно будет поставить знак «минус». Например в нашем примере это будет выглядеть так:

Тогда смотрите, как после этого изменится наша выдача. Ни одного упоминания о группе. Нет, конечно упоминания есть, но без тех слов, что мы вычеркнули.

Как правильно искать в Google?

Для начала, не стоит забывать что алгоритм выдачи Google нечувствителен к регистру, проще говоря если вы введёте в запрос «Россия» или «россия» то результат поиска не изменится. Однако данный поисковик весьма чувствителен к алгоритму поисковых операторов, именно по этой причине результаты поиска по запросам «Windows OR Linux» и «Windows or Linux» могут координально отличаться.

Следующие, что стоит учитывать, это то что поисковик Google не учитывает многие слова – связки, например, такие как «и», «а», «но» и подобные. По этой причине результат поисковой выдачи никак не зависит от их употребления.

В – третьих, для того чтобы правильно искать в этом поисковике, следует помнить о наличии определенных операторов (символы или слова уточняющие поиск) и научиться ими пользоваться.

Такими операторами, пользуется не только Google, но и другие поисковики, например, Yandex.

Итак, операторы Google которые помогут вам в поиске нужной информации:

«+»

— лучше использовать тогда, когда нужно найти документы содержащие более двух слов, к примеру, «SEO + инструменты».

«-»

— нужно использовать для исключения из выдачи документов, содержащих какое – нибудь слово например, «напитки — безалкогольные». В таком случае поисковик найдет исключительно алкогольные напитки.

«OR»

— необходим для поиска документов, содержащих одно из нескольких слов, к примеру, «женщина OR девушка».

«“”»

— нужно для того, чтобы найти документы, в которых есть определенная фраза в таком же виде, в каком она используется в качестве поискового запроса, например «купить телевизор Тверь»

«~»

— необходим для поиска синонимов слов, которые указаны в запросе, например, «имиджевые ~ смартфоны».

«..»

— используется в том случае, если необходимо найти документы в которых содержатся числовые значения в указанных интервалах, например «300…500 рублей в сутки».

Существуют и более популярные операторы Google для правильного поиска, среди которых среднестатистическому пользователю этой поисковой системы могут потребоваться следующие.

«daterange:»

— нужен для поиска документов созданных в определенный промежуток времени, к примеру, «пожар в Киеве daterange:20092011-21102010».

«filetype:»

— используется при поиске ссылок на документ определенного типа, например, «автобиография Солженицына filetype:rtf».

«site:»

— нужен для того, чтобы отыскать все страницы нужного вам сайта или страницы сайта, содержащих определенное слово, например, «site:dirfreesoft.ru антивирус».

«phonebook:»

— весьма нужный оператор, который ищет телефонные номера по указанным параметрам, к примеру, «phonebook: гостиницы Омск».

Оказывается не так уж и сложно искать в Google правильно если знаешь как.

Как исключить из выдачи страницы «для взрослых»

Выберите режим фильтрации поисковой выдачи от документов, содержащих ненормативную лексику и контент «для взрослых»:

  • Семейный поиск — из результатов поиска полностью исключается контент «для взрослых» (даже если запрос явно направлен на поиск таких ресурсов), а также сайты, содержащие нецензурную лексику</span>;

  • Умеренный фильтр — из результатов поиска исключаются сайты «для взрослых», если запрос явно не направлен на поиск таких ресурсов (режим включен по умолчанию)</span>;

  • Без ограничений — в результатах поиска присутствуют все найденные по запросу документы, включая интернет-ресурсы «для взрослых».

Настроить фильтрацию можно одним из следующих способов:

  • Выберите необходимое значение на странице Настройка поиска (ссылка Настройки в нижней части страницы поисковой выдачи).
  • Пропишите в файле hosts IP-адрес Яндекса с предустановленным семейным поиском.

Специальные символы и операторы для уточнения поисковых запросов в Google

Символ @. Позволяет выполнить поиск в документах, опубликованных в определенной социальной сети. Ее название нужно указать после символа.

Символ #. Создан для поиска нужного контента по хештегам. Необходимое слово или фразу нужно указать после символа.

Символ -. Используется для исключения из результатов поиска документов, содержащих слово, перед которым стоит этот знак.

Двойные кавычки. Если нужную фразу взять в кавычки, то поисковик будет отбирать контент с фразой или словом в указанном порядке и форме.

Звездочка. Предназначена для поиска фразы с неизвестным словом. Фразу нужно взять в двойные кавычки, а на месте неизвестного слова поставить звездочку.

Две последовательные точки. Используются для поиска в рамках указанного числового диапазона.

Оператор OR. Позволяет объединять разные запросы.

Оператор site:. Необходим при поиске всех документов, расположенных по указанному адресу.

Оператор related:. Дает возможность найти ресурсы с похожим контентом.

Оператор info:. С его помощью можно получить подробную информацию о сайте.

Оператор cache:. Предназначен для поиска контента в кеше поисковой системы.

title=

Поисковые операторы используют для уточнения запросов и получения релевантных результатов. Поисковая система Google не учитывает в запросах знаки препинания, которые не относятся к операторам поиска. При использовании перечисленных операторов и символов не стоит забывать, что между ними и поисковым словом или фразой не должно быть пробела. Иначе указанное уточнение работать не будет.

Эти особенности поиска в «Яндексе» и Google помогают подбирать ключевые фразы для составления сематического ядра, обнаруживать недостатки в реализуемом сетевом проекте, анализировать работу конкурентов, быстрее находить специализированную информацию.

Как работает поиск

Вы, скорее всего, слышали про индекс – это набор файлов, в которых содержится разнообразная информация о файлах и документах, хранящихся на диске. Когда вы пользуетесь поиском, именно индексные файлы позволяют быстро отобразить результаты. В индекс попадают различные свойства файлов, и это не только путь, название или размер. Например, у MP3 файлов индексируются все теги – от автора до скорости потока. У офисных документов индексируются данные, которые можно увидеть в свойствах файла на вкладке Подробно , содержимое документа, и так далее. Если такой поиск вам в новинку, я рекомендую прочесть пару статей в справке, чтобы получить вводную информацию и поиске. Сверните все окна, нажмите F1 и в поле Поиск в справке введите… Поиск.

Индексирование происходит постоянно – если вы добавите, удалите или измените файл в папке, это немедленно отразится в индексе.

На скриншоте показаны местоположения, которые индексируются по умолчанию. Поэтому если вы храните свои документы где-нибудь в F:Documents, они в индекс не попадут и быстрым поиском не найдутся – их нужно добавить в индекс отдельно. О настройке поиска речь и пойдет ниже.

Как правильно искать в Yandex?

Ответ на этот, вроде бы глупый вопрос на деле знают отнюдь далеко не все пользователи Яндекса. Причина кроется в том, что наибольшее количество пользователей интернет ресурсами далеко не полностью используют возможности поисковых программ, как раз по этому в определенных случаях у многих пользователей поисковиков могут возникать какие – либо препятствия и трудности при поиске нужной информации.

Ну так и как же правильно пользоваться поисковой системой Яндекса – самым популярным поисковиком в русскоязычном сегменте Всемирной Сети?

1.

Если необходимо найти определенную, конкретно сформулированную фразу. Поиск такие фраз наиболее удобно использовать с помощью оператора » «, иначе выражаясь для того чтобы найти web-документ в котором находиться нужная вам фраза, её следует напечатать в кавычках. Например, «Какие файлы можно исключить из проверки на наличие вирусов?»

2.

Если нужно найти цитату, но некоторые слова вы запамятовали или попросту не знаете. Сложности в этом нет. В таком случае следует заключить в кавычки полностью всю фразу, а на места забытых слов нужно поставить знак «*». Например, «Я к вам * чего же боле».

3.

Если нужно сформировать выдачу по нескольким словам или фразам одновременно. Для такой операции следует привлечь к работе оператора |, его нужно использовать после каждого искомого слова или фразы. Например, малина | земляника | клубника.

4.

Если вам предстоит отыскать несколько слов, которые находятся в одном предложении. При выполнении это задачи нужно воспользоваться оператором &, его нужно ставить между искомыми словами. К примеру, памятник Маяковскому & Самара.

5.

Если нужно отыскать документ, которые содержит то или иное слово. Для этого следует воспользоваться оператором +. Его следует использовать перед искомыми словами и не следует разделять пробелом. Так же запрос может содержать уточняющие слова или фразы. Например, памятник Чапаеву +сквер.

6.

Если из поиска вам необходимо исключить документы, в которых содержится какое – либо конкретное слово. То нужно использовать оператор -. Его ставят перед словами которые нужно исключить и не разделяют пробелом. Например, современный ноутбук –купить.

7.

Если нужно найти информацию только с определенного сайта. В таком случае поможет оператор site. Его используют одновременно с двоеточием и ставят непосредственно перед названием сайта. Например, PDF site:dirfreesoft.ru

8.

Если вам потребуется отыскать документы того или иного типа. При поиске таких файлов следует воспользоваться оператором mine. Его также используют с двоеточием. Например, инструкция к HTS mine:doc.

9.

Если нужно найти информацию на определенном языке. При такой задаче нужно воспользоваться оператором lang, после которого следует ставить двоеточие и уточняют выбранный язык для документов которые вы ищете. Например, Angels and Demons lang:ru.

Другие устройства

Синхронизация браузера с другими устройствами позволяет работать с разных устройств смартфон планшет другой ПК, используя один логин и пароль от Яндекса. Благодаря синхронизации у вас всегда есть доступ к своим настройкам, пользовательским данным, почтовым, и другим сервисам Яндекса. Где бы вы ни были — хоть в поезде, хоть дома, хоть на работе.

Контекстное меню пункта «Настройки Яндекс.браузера» содержит самые важные разделы настроек. Здесь мы можем в один клик включить режим турбо, если сайты начали медленно загружаться. Открыть новую вкладку в режиме инкогнито.

В режиме Инкогнито не сохраняется никакая информация о странице. После закрытия вкладки в этом режиме все данные о сеансе будут удалены.  Настройки возвращены в исходное состояние, удалены закладки, кроме загруженных на ПК файлов.

Отсюда мы можем быстро открыть историю или страницу загрузок, раздел паролей и карт. А также  перейти в раздел «Дополнения». В разделе «Дополнительно» посмотреть версию браузера и обновить его, если актуальная версия будет доступна. И ещё несколько полезных функций.

Яндекс

Яндекс поддерживает собственные операторы запросов, периодически внося изменения в поиск. В 2017 году поисковик прекратил поддержку некоторых операторов, которые редко использовались вебмастерами. В данной таблице представлены операторы, которые поддерживаются Яндексом в настоящий момент. Некоторые, наиболее популярные из них, можно также найти в расширенном поиске.

Поисковые операторы Яндекса

Оператор

Предназначение

Примечание

+

(плюс)

Поиск документов, обязательно содержащих слово, перед которым стоит оператор +.

Пример: алгоритм +трафик.

Возможно использование нескольких + в одном запросе.

(звездочка)

Используется вместе с оператором » для обозначения пропущенного слова.

Пример: «на * висел замок»

Оператор * отделяется пробелами от других слов. Можно ставить несколько * в одной цитате.

|

(или)

Поиск документов с одним из слов, содержащихся в запросе и разделенным оператором |.

Оператор можно использовать и для поиска на двух сайтах для определения текстовых постфильтров. На данный момент конструкция еще сохранила работоспособность, хотя и не должна.

Пример: site:seointellect.ru | site:seo-kursy.com

Можно применять несколько | в запросе, отделяя оператор пробелами.

(минус)

Исключение определенного слова, перед которым стоит данный оператор, из поиска.

Пример: алгоритм -поиск.

Допускается использование нескольких операторов — в одном запросе.

«

(кавычки)

Поиск слов в определенном порядке, точной фразы в документах.

Пример: «аудит сообщества вконтакте»

Оператор » можно использовать с поиском по сайту для определения дублей страниц.

Поиск слова в заданной форме с учетом числа, падежа и времени.

Пример: билет в !москву.

Можно использовать несколько ! в одном запросе. Соответствует фильтру расширенного поиска «Точно как в запросе».

Документные операторы Яндекса

Оператор

Предназначение

Примечание

site:

Поиск по сайту и его поддоменам.

Пример: контекстная реклама site:seonews.ru

url:

Поиск на заданном URL. Если хотите найти страницы, адреса которых начинаются с заданного значения, используйте в конце оператор *.

Пример: ранжирование url:ru.wikipedia.org/wiki/*

Если URL содержит символы ‘ » ( ) _, его необходимо заключить в кавычки в запросе.

inurl:

Поиск фразы по страницам с вхождением в URL слов после оператора inurl.

Пример: продвижение сайтов inurl:seointellect.

Поиск страниц с нужным вхождением в URL.

Пример: site:seointellect.ru inurl:seo-stati.

Поиск страниц с нужным вхождением в URL интересен специалистам тем, что может использоваться для поиска мусорных страниц.

domain:

Поиск по страницам на заданном домене.

Пример: тематические порталы domain:com

mime:

Поиск документов необходимого формата файла.

Пример: аудит сайта mime:doc

Яндекс поддерживает поиск форматов html, xls, xlsx, ods, doc, docx,pdf, ppt,odg, rtf,odt, pptx, swf, odp.

lang:

Поиск документов на заданном языке.

Пример: seo lang:fr.

Поиск поддерживает русский (ru), английский (en), французский (fr), немецкий (de), украинский (uk), белорусский (be), татарский (tt), турецкий (tr), казахский (kk) и другие языки.

date:

Поиск документов по указанной дате их последнего изменения.

Чтобы найти документы, последнее изменение которых было в указанную дату, введите точные числовые значения.

Пример: апдейт date:20170414.

Для поиска документов, изменение которых произошло до указанной даты, следует использовать символы , >=.

Пример: ссылочный взрыв date:>20180130.

Год необходимо указывать в обязательном порядке. Вместо месяца и дня изменения страницы можно вставить символ *.

cat:

Поиск по сайтам, которые зарегистрированы в Яндекс.Каталоге. После оператора необходимо задать регион или ID тематической рубрики.

Пример: cat:ID региона,

cat:ID темы

Идентификатор региона = 11000000 + код региона.

Идентификатор тематической рубрики = 9000000 + код темы.

host:

Поиск по страницам на хосте.

Пример: рейтинги host:www.seonews.ru

Соответствует оператору url: с заданным именем хоста.

rhost:

Поиск по страницам на хосте, записанном в обратном порядке: сначала домен верхнего уровня, затем домен второго уровня.

Пример: каталог rhost:ru.seonews.www

Если поставить в конце URL *, будет осуществлен поиск по всем поддоменам.

relseo:

Показ релевантности сайта по фразе.

Пример: relseo:»продвижение сайтов» site:seointellect.ru.

ШУТКА! нет такого оператора:)

Дополнения

Интересный и весьма полезный раздел «Дополнения». Изначально в Яндекс.Браузере уже установлено несколько расширений. Также вы можете установить сторонние расширения, кликнув на кнопку в конце списка «Каталог расширений Яндекс.Браузера. Примечательно, что Яндекс не имеет своего магазина расширений, для установки дополнений в Яндекс.Браузер используется каталог расширения Оперы.

Не увлекайтесь расширениями. Каждое новое расширение, установленное в браузере, нагружает систему и  отнимает часть оперативной памяти.

Используйте расширения, без которых невозможно обойтись в ежедневной работе. Для редких случаев можно использовать аналоги десктопных программ.

Яндекс дорки?

Поиск в Яндекс, безусловно, может оказаться полезным для исследователей на основе открытых источников. В том числе, при поиске утечек.

А как насчёт поиска в Яндекс для хакеров и пентестеров? Хотя язык запросов Яндекса менее гибок, всё равно и через Яндекс можно найти разнообразную чувствительную информацию и файлы, не предназначенные для всеобщего доступа.

Брутфорс поддоменов по одной букве

Мы уже рассматривали как с помощью Гугл перечислеть поддомены. Там же я говорил про плюсы и минусы этого способа. В Яндекс тоже есть такая возможность. Причём, для тех сайтов, которые я попробовал, Яндекс знает больше субдоменов чем Google!

Для этого можно использовать оператор rhost: Напомню, при нём домен/поддомен пишется в обратном порядке, т.е. начиная с домена верхнего уровня, затем домен второго уровня, затем поддомен третьего уровня и так далее.

Самое интересное – используя подстановочный символ * мы можем искать по части поддомена – к слову, Google не воспринимает частично написанные домены вообще.

Допустим, меня интересуют поддомены сайта kali.org. Я делаю запросы вида:

В результате я нашёл несколько новых субдоменов, которые не смог найти с помощью Гугл:

  • buildd-amd64.kali.org
  • eros.kali.org
  • eos.kali.org
  • iris.kali.org
  • images.kali.org

Можно создать скрипт и при правильно написанном алгоритме можно получить весь список субдоменов за несколько десятков запросов либо сотен запросов (в зависимости от выбранного алгоритма) – это может конкурировать с брут-форсом субдоменов по словарю

Самое важное – кроме Яндекса запросы никуда больше не делаются

Аналогично для offensive-security.com с помощью Яндекса я нашёл субдомены, о которых не знал Гугл:

  • download.offensive-security.com
  • forums.offensive-security.com
  • images.offensive-security.com
  • support.offensive-security.com
  • screenconnect.offensive-security.com:8040

Поиск папок с открытым листингом

В таких папках может быть что угодно – от публичных файлообменников до личных фото архивов.

Иногда там можно найти файлы со списком паролей:

Причём разных пользователей:

Способ 3: Яндекс.Исследования

Сервисы Yandex накапливают огромное количество данных, которые позволяют сделать вывод об окружающем мире, изменениях, происходящих в нем, и интересах людей. Все исследования компании находятся в свободном доступе. С их результатами можно ознакомится в специальном разделе.

  1. Открываем страницу с исследованиями Яндекса. Нас интересуют данные, связанные с поисковыми запросами, поэтому воспользуемся фильтром. Кликаем по полю «Все темы» и в контекстном меню выбираем «Поиск».

После загрузки страницы выбираем в списке интересующее исследование.

Сложно обобщить все поисковые запросы в одну категорию, поэтому Yandex распределяет их по темам и подает информацию блоками.

Также компания проводит исследования по главным темам, которыми пользователи интересовались в течение года.

В такие отчеты обычно попадают популярные люди, важные события и мероприятия в политике, кинопроизводстве, игровой, спортивной, музыкальной индустрии и др. Учитываются и наиболее распространенные запросы, по которым пользователи это ищут.

Чтобы получать уведомления о новых исследованиях Yandex, в верхней части главой страницы жмем кнопку «Подписаться», вводим электронный адрес и нажимаем «Готово».

Также на странице «О компании» можно в прямом эфире узнать, что люди ищут в Яндексе. Но использовать такие данные не получится, так как транслируются не все подряд запросы, а отбираются они случайным образом.

Опишите, что у вас не получилось.
Наши специалисты постараются ответить максимально быстро.

Системные

Последний, но не по значению пункт настроек браузера.

  • Выставьте режим «Никогда» в пункте «Запускать браузер вместе с Windows».
  • Снимите галочку с пункта «Использовать аппаратное ускорение» — данный пункт часто приводит к тому, что видео воспроизводится с черным экраном или, вообще, не воспроизводится.
  • Остальные пункты можно оставить как есть.
  • Если вы изменили параметры и результат вас не устроил всегда можно сбросить настройки на стандартные.
  • Для лучшей поисковой выдачи здесь можно настроить регион и персональные данные. В частности, это касается отправки статистики сервисам Яндекса. Если не хотите делиться данной информацией синаем эти метки.

Обновление поиска

«Яндекс» запустил новое обновление поисковика под названием «Вега». Об этом CNews сообщила пресс-служба компании. По сравнению со старой версией в «Вегу» за последний год было добавлено более 1,5 тыс. улучшений, отмечает «Яндекс».

В частности, теперь поисковик выдает более точные и быстрые ответы на запросы, а поисковый алгоритм обучается с учетом сигналов от экспертов по оценке. Также появилась возможность гиперлокального поиска в конкретном микрорайоне, квартале или даже доме.

Руководитель поискового портала «Яндекса» Андрей Стыскин отметил, что обновление включает в себя новую систему хранения веб-документов, технологию предзагрузки результатов поиска и другие решения. По его словам, доля поиска «Яндекса» на всех платформах в настоящий момент достигает 57,9%, а доля на Android за год показала рост на 4,8 процентных пункта и составила 54,7%.

Итоги

Что в итоге? У нас появилась своя инфраструктура обучения и дистилляции тяжёлых моделей, адаптированная под наш стек задач ранжирования. С её помощью мы сначала обучили большие модели-трансформеры высокого качества, а затем дистиллировали их в многозадачную split-модель, которая внедрена в рантайм на GPU в виде нескольких частей, независимо применяемых к запросу и документу.

Это внедрение принесло нам рекордные улучшения в ранжировании за последние 10 лет (со времён внедрения Матрикснета). Просто для сравнения: Палех и Королёв вместе повлияли на поиск меньше, чем новая модель на трансформерах. Более того, в поиске рассчитываются тысячи факторов, но если выключить их все и оставить только новую модель, то качество ранжирования по основной офлайн-метрике упадёт лишь на 4-5%! 

В таблице ниже сравнивается качество нескольких нейросетевых алгоритмов в задаче ранжирования. “% NDCG” — это нормированное значение обычной метрики качества DCG по отношению к идеальному ранжированию на нашем датасете. 100% означает, что модель располагает документы в порядке убывания их истинных офлайн-оценок. Худший результат ожидаемо даёт подход предыдущего поколения, то есть просто обучение feed-forward-сети на кликовый таргет. Дообучение готовых моделей BERT существенно проигрывает по качеству специализированной версии, которая показывает рекордный результат в 95,4% — сравнимо с качеством дистилляции YATI в feed-forward-сеть. Все модели, кроме первой, дообучались на одном и том же множестве экспертных оценок.

Приводимые числа показывают: несмотря на универсальность нейросетей последнего поколения, их адаптация к конкретным задачам на практике даёт существенный прирост эффективности

Это особенно важно для промышленных применений под высокой нагрузкой. Тем не менее очевидная ценность универсальных моделей в том, что они позволяют добиться достаточно хороших результатов на широком круге NLP-задач при минимальном вложении времени и ресурсов

В начале поста я рассказал про ощущение поиска по смыслу. Применение тяжёлых (как мы сейчас о них думаем) нейросетевых моделей, которые точнее приближают структуру естественного языка и лучше учитывают семантические связи между словами в тексте, поможет нашим пользователям встречаться с этим эффектом ещё чаще, чем раньше. И может быть, однажды нам уже будет непросто отличить иллюзию от реальности. Но до этого, я уверен, в качестве поиска ещё предстоит сделать много нового и интересного. 

Спасибо за внимание

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий