Новости

Baltic Digital Days 2017: Исследование качества сервисов кластеризации по поисковой выдаче

Автор Дата 17.08.2017

Продолжаем обследование программной части конференции Baltic Digital Days, которая сейчас в пятый раз проходит в Калининграде. В рамках секции «SEO в русскоязычном интернете» Алексюха Ожгибесов представил доклад на тему «Исследование качества сервисов кластеризации сообразно поисковой выдаче».


Свое выступление спикер начал с цитирования самых распространенных вопросов клиентов:

  • Каковой кластеризатор лучше?
  • Какая степень лучше?
  • Как им использовать и так далее.

Когда я начал вести вебинары, сии вопросы мне стали задавать каждый день. Видишь почему я решил взять на себя ответственность и натворить правдивый, объективный рейтинг существующих ТОП-овых кластеризаторов, – пояснил некто.

Существует проблема в кластеризации: чтобы сделать качественное суть, нужно проанализировать нишу, понять, чем занимается заказчик, свести данные воедино, подготовить запросы для парсинга, залезть в чужой карман множество запросов из источников, все это увидеть по кластеризации по ТОПу, а потом еще ручным способом. Ant. автоматический доанализировать, сгруппировать по контенту. В результате проект отсюда следует нереально долгим и затратным.

Таким образом, большую кусок времени при составлении семантического ядра занимает:

1. Предварительный испытание структуры сайтов конкурентов.

2. Подготовка входных групп во (избежание парсинга и дальнейшая очистка данных от мусора.

3. Кластеризация запросов.

Кластеризаторы призваны расщелкать эту проблему.

Рейтинг 8 кластеризаторов

В ходе исследования пизда экспертами стояла задача получить рейтинг не ровно по конкретной тематике, а сразу по нескольким тематикам. Почему брали примерно по 30% каждого из сих параметров. Были и низкочастотные запросы. Изначально на входе было 116 тематических ядер общим объемом получи 102 тысячи запросов.

Но есть проблема: требования собирала моя команда, и они не идеальны, – добавил Алик. – Но при этом нам нужно было нарисовать выборку идеальной и репрезентативной для доклада. Что автор делаем дальше? Мы предполагаем, что нельзя стоимость) правильность кластеризации во всему ядру в целом. Автор этих строк будем сравнивать не по семантике, а по на нос конкретному кластеру.

Допустим, есть 180 запросов, и после 170 запросам сайт занимает с 1 по 5 позицию. Около этом запрос №180 занимает позиции с 5 по 10. Не кто иной первый вариант будет наиболее интересен, поскольку по мнению нему сайт смог попасть в ТОП.

У нас был монета запросов, все данные поисковой выдачи были получены чрез прокси, и по каждому URL сформировали ТОП-10 сайтов.

Через некот необходимо отыскать наилучшие по количеству совпадений требования из общего числа.

Выделенные сайты нужно разобрать с точки зрения позиции в выдаче:

По итогам анализа очень может быть, что по кластеру «расчет ОСАГО» в ТОПе выдачи находится соседний сайт:

Всего 189 запросов, на одной странице по мнению одному кластеру, из них в ТОП-1 – 69, ТОП-10 – 31.

Чисто касается одной известной всем компании, то на нее результат оказался чуть хуже:

Далее долженствует полуинформационный-полукоммерческий сайт, здесь результаты гораздо не годится в подметки:

Для дальнейшего разбора кластеризаторов будет использоваться средство www.bonus-malus.ru.

Что делаем дальше?

Далее неизбежно обратиться к сервису кластеризации и выгрузить все запросы точно по странице, которая, согласно приведенным выше данным, была идеальной. С этой целью был выполнен экспортирование запросов из Serpstat по странице https://www.bonus- malus.ru/osago/kalkuljator.html.

Подле этом позиции ниже ТОП-10 в расчет исторгать не нужно. Далее производят сравнение исходного кластера, тот или иной был представлен в семантике, с кластером сайта. Аналогичное отож(д)ествление производится по каждому кластеру в исходном семантическом ядре. Всего лишь после этого будет получен результат.

Тематика «ОСАГО страхование» бог популярна, и здесь данные идеальные.

Однако и здесь никак не бывает идеальной ситуации. Так, например, в ходе эксперимента возникли проблемы: рацион семантических ядер была не так хороша, наподобие того бы хотелось.

К нам обращаются совсем различные бизнесы. 37% тех, с которыми все получилось: вот-первых, это узкая тематика, – пояснил Александр:

В-вторых, тематика и регион.

Представители сервисов кластеризации часто подчеркивают, что SEO-специалисты неправильно работают с ними. Невыгодный нужно подавать голые парсинги из Вордстат, подсказок и прощай прочего, нужно изначально делать оценку, убирать переизбыток, предоставлять на вход более-менее правильные цифирь, и тогда вы получите реальный, крутой результат.

Манером) и есть, мы используем данные кластеризации, но чуть в таком фоне, а не в фоне «спарсили и отдали бери вход». Поэтому данные, которые мы подавали в вход — это наши ядра, которые я продали, которые прошли оценку качества, у которых аминь круто, – согласился с позицией сервисов спикер.

Иными словами, цифирь, которые подаются на вход, являются максимально объективными до требованию самих же кластеризаторов. Это не в какой-нибудь месяц очищенные от мусора запросы, а готовая группировка, нате основе которых строится структура и продвижение реальных сайтов. Цифры, которые вы получите, применив эту методику возьми «голом» парсинге, никак не могут соотноситься с текущим исследованием!

Кластеризация проводилась в каждом изо сервисов в одно и то же время.

Но во время оно чем представить слушателям рейтинг сервисов, Александр продемонстрировал проблемные моменты, с которыми столкнулся кайфовый время проведения анализа.

На слайде представлены 3 кластера

Встарь всего, это дублирование кластеров:

Важно понимать, точно:

  1. салют
  2. фейерверки
  3. салют и фейерверки

Это три разных кластера.

В ведь же время рядовой специалист работает по следующей схеме: выгружает костяк из 60 тыс. запросов и отдает это для вход. Кластеризаторы выдают самый большой кластер, объединение которому и формируется ТОП. При таком подходе нажить качественный результат невозможно.

Вот как должна проводиться эксплуатация по кластеризации в идеале:

Еще одна существенная засада — это отсутствие кластеризации в регионах. Стоит лишь копануть чуть глубже и можно получить абсолютно разные кластеры. Нате слайде видна статистика по 2400 запросам.

Ибо отдельные запросы нередко «прыгают» по кластерам, звучит сформировать структуру запросов, статьи, сайта и распределить некластеризованные требования:

Важно понимать, что есть множество запросов, которые в принципе никак не кластеризуются.

Дополнительно спикер пояснил, что сбор семантики — сие отдельный бизнес-процесс, и в каждой уважающей себя SEO-компании питаться целый отдел, который им занимается.

Я не призываю вам не использовать кластеризацию, я призываю думать своей головой. Кластеризация сие круто, — пояснил Александр.

Семь параметров оценки

В ходе анализа кластеризаторов использовали 7 параметров оценки:

1 параметр — сие сильное совпадение. К примеру, есть исходный кластер и трескать (за (в) обе щеки) кластер кластеризатор, он на 60% повторяет свой кластер, от 60 до 100% — это блестящий показатель.

2 параметр — слабое совпадение, когда процент совпадений изо кластера сервиса составляет от 59 до 21% с исходным кластером. Сие тоже неплохо.

3 параметр — когда идет сильное совместимость (от 20 до 0%). Это не первоклассно.

4 параметр — процент некластеризованного. То есть процент запросов с кластеризации сервиса, которые оказались непригодными для кластеризации до сравнению с исходным кластером.

5 параметр — совпадение по важным запросам. Ведь есть совпадения по частотным запросам в тематике.

6 параметр — тождественность по второстепенным запросам. Этот параметр характерен как для очень крупных бизнесов.

7 параметр — совпадение вдоль ТОПу. Сравнение проводится по методологии оценки исходной группировки, хотя с учетом дублей по кластерам.

Вот такие показания удалось получить по каждому ядру.

Key Collector крут!

Что же касается сильного совпадения, здесь данные оказались следующими:

По прошествии времени сравниваем слабое совпадение:

Сильное несовпадение:

Некластиризовано:

Единство по важным:

Совпадение по второстепенным:

Вхождение в ТОП:

Спустя некоторое время были выбраны лучшие кластеризации, которые будут представлены вверх:

Итоговая оценка получилась такой:

Что касается вхождения объединение ТОПу, то у 40% кластеризаторов проблем с этим параметром вышел. Однако в целом кластеризаторы уступают специалистам и всем сервисам лопать, куда расти.

Сделать однозначный вывод о том, экий из кластеризаторов лучший, невозможно. Ведь следует прислушиваться все предыдущие параметры, на основе которых проводился исследование: где-то Rush Soft реально проигрывает Just-Magic, а идеже-то Топвизор выигрывает у Rush Soft, но сие исключение из правил.

В таблицах представлены общие материал по 116 тысячам запросов. Я считаю, это беспристрастно, – подвел итог исследования спикер. 

Источник: www.seonews.ru