Neural Matching – новый алгоритм Google
Автор: Роджер Монти (Roger Montti) – SEO-практик, модератор форума WebmasterWorld, постоянный автор Search Engine Journal.
Google далеко не всегда использует те алгоритмы, которые описывает в своих патентах и научных статьях. Однако какая-то часть опубликованных алгоритмов всё же задействована в работе поисковой системы.
Также стоит указать, что компания обычно не отвечает на вопросы касательно использования конкретного алгоритма.
В прошлом Google обсуждал некоторые алгоритмы в общих чертах – такие как Panda и Penguin. Похоже, что в случае с Neural Matching сложилась похожая ситуация. В частности, Дэнни Салливан поделился в Twitter некоторыми деталями того, как работает этот алгоритм.
«Нейронное сопоставление – это AI-метод, предназначенный для лучшего связывания слов с концептами».
Позже он добавил, что пользователи нередко могут указывать в запросе одно, а подразумевать другое, и приложил скриншот, где показано, как одно и то же слово может иметь несколько разных значений.
Искусственный интеллект, глубокое обучение и ранжирование
Недавно в блоге Google AI была опубликована следующая статья: «Deep Relevance Ranking using Enhanced Document-Query Interactions».
Хотя это исследование относительно новое, оно основано на уже известном ИИ-методе выполнения задач под названием Document Relevance Ranking. Этот метод также известен как Ad-hoc Retrieval (информационный поиск по произвольному запросу).
Мы не можем утверждать, что представленный в статье алгоритм является частью того, что Google называет Neural Matching. При этом интересно подробнее изучить то, что имеет похожий принцип работы.
Вот как в статье описывается Ad-hoc Retrieval:
«Метод Document Relevance Ranking, также известный как Ad-hoc Retrieval… заключается в ранжировании документов из широкой выборки с использованием только запроса и текста каждого документа».
То есть, в этом типе ранжирования используется только поисковый запрос и веб-страницы, без учёта других факторов. Далее в документе говорится, что:
«Это контрастирует со стандартными системами поиска информации (information retrieval, IR), которые полагаются на текстовые сигналы в сочетании с сетевой структурой (Page et al., 1999; Kleinberg, 1999) и/или обратную связь от пользователей (Joachims, 2002)».
В целом из документа понятно, что Document Relevance Ranking – это относительно новый метод ранжирования веб-страниц, который не полагается на ссылочные сигналы.
Новый подход к ранжированию
Новый алгоритм, опубликованный в ИИ-блоге Google, не основан на традиционных факторах ранжирования. Однако эти факторы используются в первую очередь. Затем в работу вступает та часть алгоритма, что связана с Ad-hoc retrieval. На этом этапе выполняется повторное ранжирование уже проранжированных страниц.
Это значит, что традиционные сигналы ранжирования по-прежнему используются, но они не определяют то, какие страницы будут находиться в топ-10 поисковой выдачи.
Таким образом, можно сказать, что традиционные сигналы ранжирования выполняют функцию предварительного отбора. Они позволяют Google отсеять спам и выбрать самые релевантные документы.
Новый же алгоритм повторно ранжирует эти страницы согласно совершенно другому набору критериев для определения того, что Дэнни Салливан назвал «суперсинонимами».
Использование сигналов ранжирования на первом этапе – это то, что отличает данный алгоритм от опубликованного в 2016 году алгоритма под названием Deep Relevance Matching Model (DRMM).
Как работает этот алгоритм?
Его цель – сопоставлять поисковый запрос с веб-страницей, используя только запрос и только страницу. Веб-страницы, ранжируемые таким алгоритмом, не будут продвигаться в топ поисковой выдачи благодаря ссылкам или ключевым словам, поскольку этот алгоритм по-другому определяет соответствие.
«Мы изучили несколько новых моделей для Document Relevance Ranking, созданных на основе Deep Relevance Matching Model (DRMM)… В отличие от метода DRMM, в котором используются нечувствительные к контексту кодировки терминов и взаимодействия между запросами и документами, мы внедряем расширенные контекстно-зависимые кодировки во всех наших моделях».
Контент становится более важным
Значит ли это, что вебмастерам нужно использовать больше синонимов? Вряд ли. Цель Google – понимать контекст и значение страницы. Именно поэтому поисковая система работает над лучшим пониманием синонимов. Таким образом, чёткая и последовательная передача информации является более важной, чем наполнение страницы ключевыми словами и синонимами.
Google официально заявил, что способен понимать концепты, а это выходит за пределы просто ключевых слов и синонимов. Это более естественное понимание того, как веб-страница решает проблему, заключённую в поисковом запросе.
Согласно недавнему заявлению Google:
«Мы достигли той точки, когда нейронные сети могут помочь нам сделать рывок от понимания слов к пониманию концептов. Neural Embeddings – подход, разработанный в области нейросетей, позволяет нам трансформировать слова в более широкие сущности базовых понятий, а затем сопоставлять концепты в запросе с концептами в документе. Мы называем эту технику нейронным сопоставлением».
Что же такое Neural Matching?
Есть вероятность, что Neural Matching включает элементы этого алгоритма в сочетании с элементами других алгоритмов. Использует ли Google именно этот алгоритм не так важно. Главное, что ранжирование документов с использованием только поискового запроса и контента страницы, возможно.
Мы надеемся, что понимание этого факта поможет владельцам сайтов избежать использования таких неэффективных стратегий, как избыточное добавление синонимов.
Новый тип ИИ-ранжирования показывает, как могут генерироваться результаты поиска, напрямую не формируемые традиционными факторами ранжирования. И это требует большего внимания к таким вещам, как поисковое намерение и понимание того, как контент страницы помогает пользователю.
Материалы по теме:
Окно Овертона в интернет-маркетинге, как незаметно продвигать любые идеи и продуктыЦенообразование в современной экономике
Индексация
Пингвин (Google Penguin)
Фильтры поисковых систем
Бренд как главное SEO-оружие
Основные понятия SEO
90 % поискового трафика ИИ игнорирует мобильную стратегию
Роль ссылок в SEO: семь ключевых принципов для успешного продвижения сайта
Продвижение услуг
SEO больше не работает как раньше. Что теперь?
X-факторы (UX-сигналы)
Почему Яндекс Директ не работает в B2B — и как это исправить
Контент, созданный ИИ, безопасен для SEO: итоги масштабного анализа
Тёмная сторона SEO
nofollow / dofollow
PBN (Private Blog Network) —
Естественные ссылки (Natural Links)
Анкор (Anchor)
Когда не стоит делать SEO
Комплексное продвижение сайтов в России
Как заказать продвижение сайта
Фильтры Яндекса
Интернет продвижение 2025
Нейропоиск меняет трафик
Органический трафик на новостные сайты продолжает снижаться
Настройка региона сайта
Donor site (Сайт-донор)
Обратная ссылка (Backlink)
Картинка в WebP
Уникальность контента
Alt-атрибут
7 ошибок – почему сайт не продвигается в поиске
Ошибка редактора WordPress
Внутренняя перелинковка
H1, H2, H3 (Заголовки на странице)
Description (Мета-описание страницы)
Title (Заголовок страницы)
Core Web Vitals (Основные интернет-показатели)
HEIF (High Efficiency Image File Format)
ЧПУ (Человеко-понятные URL)
Ошибка 404 (Not Found)
Сервисы для автоматической кластеризации ключевых слов
Кластеризация ключевых слов — основа продвижения сайтов
Почему после запуска рекламы в Яндекс.Директе нет заказов
LSI (Latent Semantic Indexing)
Классификация ключевых слов по частотности
Семантическое ядро
Ключевое слово (Keyword)
Зачем SEO-специалист участвует в создании сайта
Email-рассылка –
301 редирект (постоянное перенаправление)
Canonical (канонический URL)
Sitemap.xml
Robots.txt
Конверсия
Поведенческие факторы
Bounce Rate (Показатель отказов)
CTR (Click-Through Rate) — показатель кликабельности
Ключевое слово
Органический трафик
Алгоритм ранжирования
Поисковой робот (бот, краулер)
Ценообразование в SEO: из чего складывается стоимость поискового продвижения
SERP (Search Engine Results Page)
Что такое SEO (Search Engine Optimization)
Расширенный глоссарий SEO
Основные понятия SEO
Чек-лист: как понять, что на ваш сайт накручивают поведенческие факторы
Чем сегодня заменили «ключевые слова»?
Как влияют пользовательские действия на локальную выдачу в Яндексе
💡 Примеры работ клиентов на сайте — плохая идея для B2B
🔍 Как работают поисковые системы
📌 Вебвизор 2.0
🎯 Что такое N / a (URL неизвестен)?
Google обошел Яндекс
Алгоритм Google Penguin
Об эффекте Рингельмана
VPN для чего используется в работе ?
Как ускорить удаление страниц из индекса
👨💼 Аутсорсинг продвижения сайта
16 cпocoбoв “гуглить” кaк прoфеccиoнaл
Выводов из SEO-конференций 2018 г.
Замена тИЦ на ИКС
💰 Какая разница между прогнозом ставки и списываемой суммой в Яндекс.Директ?
Спрос на услуги и товары в августе-октябре
Оценка максимально высокой позиции в органической выдачи
Нативная реклама
Перенасыщение текстов ключевыми словами (keyword stuffing) в Google
Влияние ссылок на ранжирование в западных странах
📧 Почему электронная почта лучше мессенджеров для работы над проектами
Контент или ссылки?
Влияние внешних ссылок на позиции сайта
Фильтр Яндекса Баден-Баден
Сервисы для анализа и поиск сайтов конкурентов
Минимальный срок контракта
Работы по оптимизации сайта для улучшения выдачи
Мимикрия – яндекс пессимизирует сайты за сходство с популярными ресурсами
Сколько человек должно работать в seo проекте?
Как продвигать кейтеринговые компании
Продвижение сайтов в России
Как продвигать дизайн интерьера
🔍 Зеркала, как правильно с www или без www ?
Почему мы не любим брать в продвижение новые сайты
Индексирование сайта поисковыми системами
Три причины, почему маркетологу нужно поиcковое продвижение сайта
Если упали позиции у сайта в Яндексе или Google, как восстановить позиции
Вопросы и ответы
Как пожаловаться на сайт
Cloudflare
СКОЛЬКО ВРЕМЕНИ НУЖНО ПОИСКОВИКУ ДЛЯ ИНДЕКСАЦИИ НОВЫХ ССЫЛОК
Яндекс.Советник
Ссылочный профиль
Пессимизация сайтов в Google
Упоминание бренда
Факторы ранжирования в топ-10 Google. Исследование.
Насколько пользователи доверяют результатам поиска Google
Незаметное снижение позиций
Факторы ранжирования интернет-магазина в Яндекс
Источник трафика и доходов для интернет-магазинов
Четверть владельцев бизнеса мало или ничего не знают о SEO
Google: почему улучшение контента не всегда ведет к росту позиций в выдаче
Google о выявлении дублированного контента и каноникализации
МАЛОПОЛЕЗНЫЙ КОНТЕНТ
53% ВСЕГО ТРАФИКА НА САЙТЫ
Возражения против SEO