ИнструкцияКонтекст · 20 мая 2025

Парсинг семантики через Key Collector

#Key Collector#кластеризация#минус-слова#семантика

Важное обновление

Модуль XML-River прекратил поддержку Key Collector — парсинг Вордстат через программу сейчас технически недоступен (парсинг Google — тоже). Гайд оставляем как справочный: этапы работы с минус-словами, дублями и кластеризацией актуальны. Для сбора семантики из Вордстата используйте нашу программу Wordstat DeepDive.

Рассмотрим процесс парсинга запросов Вордстат через Key Collector: от импорта фраз до выгрузки итогового файла с ключевыми словами и минус-словами.

Выгрузка файла импорта из Google Sheets в Key Collector

01 Сначала собираем маски ключевых слов в Вордстате и загружаем их в файл импорта — можно сразу разбить по группам, так удобнее парсить. Пример таблицы.

Файл импорта с масками ключевых слов

02 После заполнения таблицы скачайте файл в формате CSV.

Скачивание CSV из Google Sheets

03 Переходим в Key Collector и создаём новый проект. Называем его — после создания откроется основной интерфейс.

Создание нового проекта в Key Collector
Основной интерфейс Key Collector

04 Нажимаем «Файл» → «Импорт» → «Данные CSV».

Меню Файл в Key Collector
Импорт данных CSV

05 Выбираем наш CSV-файл. При первом импорте настройте схему данных — сопоставьте столбцы таблицы с определениями Key Collector (например: «Название группы КС» = Группа, «Все перемноженные слова» = Фраза).

Сопоставление столбцов при импорте

Нажимаем «Импортировать» — при успехе увидите такое сообщение:

Сообщение об успешном импорте

06 Возвращаемся по стрелке сверху слева в проект — справа будут ваши группы объявлений и фразы.

Группы объявлений в проекте
Фразы в проекте Key Collector

Выгрузка ключевых фраз напрямую, без файла

Фразы можно загружать и без файла импорта, но тогда они попадут в одну группу, которую придётся кластеризовать уже в Key Collector.

01 Создайте новый проект.

Новый проект

02 На вкладке «Главная» нажмите кнопку «Добавить фразы».

Кнопка «Добавить фразы»

03 Внесите список фраз (собранных заранее в Вордстате) и нажмите «Добавить».

Добавление списка фраз

04 После добавления фразы попадут в «Новую группу» и отобразятся в интерфейсе.

Добавленные фразы в группе

Настройки в парсере XML-River и запуск парсинга

01 Для парсинга используем дополнение XML-River: вкладка «Парсинг» → значок XML-River → «Собрать фразы Яндекс Вордстат».

Значок XML-River на вкладке Парсинг
Сбор фраз Яндекс Вордстат

02 Чтобы собрать фразы сразу для всех групп, выберите режим добавления фраз «Разбить по группам» и импортируйте все группы красной кнопкой. Ненужные (корзину, пустую новую группу) удалите. Тут же выставьте регион.

Режим «Разбить по группам»
Выбор региона в XML-River

03 Перейдите в настройки сверху, выставьте параметры как на скриншоте и нажмите «Начать».

Настройки парсинга XML-River

04 Процесс парсинга виден внизу. Скорость зависит от количества и частотности добавленных фраз.

Процесс парсинга

Сбор минус-слов

Минус-фразы можно собирать напрямую в Key Collector или через выгрузку запросов в генератор минус-слов (например, livepage.ua/tools/keys). Рекомендуем генератор — так удобнее. Рассмотрим оба способа.

Способ 1. С помощью Key Collector

В рабочей области просматриваем фразы, находим ненужные слова и нажимаем «Отправить в минус-слова» напротив фразы.

Кнопка «Отправить в минус-слова»

Пример: интересует слово «пробегом». В окне добавления минус-слов выбираем сверху «разбить по словам», отмечаем галкой ненужное слово и нажимаем «Добавить».

Разбить по словам

Пример 2: нужно исключить целую фразу — выбираем «исходные фразы целиком», отмечаем фразу галкой и нажимаем «Добавить».

Исходные фразы целиком

После добавления нажимаем «Показать найденные фразы» — программа подсветит все фразы с выделенным словом. Выбираем их чек-боксом и на вкладке «Данные» нажимаем «Удалить фразы».

Показать найденные фразы

Обязательно просматривайте запросы перед удалением: случайно можно заминусовать предлог или важное слово. Учитывайте, что Key Collector сам склоняет минус-фразы — добавив слово в одном склонении, вы, скорее всего, исключите и фразу в другом. Например, отминусовав «пробегом», сразу исключите и «пробег».

Подсветка минус-фраз

Способ 2. Через экспорт и генератор минус-слов

Сначала объединяем фразы в «мультигруппу»: выделяем группы мышкой с зажатым Shift (все подряд) или Ctrl (выборочно). Пустую «Новую группу» и корзину можно не выделять.

Выделение групп в мультигруппу

Нажимаем кнопку «Файл» сверху, далее «Экспорт» → «Фразы и статистика» и сохраняем файл XLS. Открываем его в Excel, копируем столбец фраз полностью и переходим в генератор минус-слов.

Кнопка Файл
Экспорт фраз и статистики

Загружаем фразы в генератор и собираем слова, кликая по ненужным.

Сбор минус-слов в генераторе

Когда минус-слова собраны, нажимаем «Получить список минус-слов», выделяем все слова (Ctrl+A) и копируем (Ctrl+C).

Список минус-слов

Возвращаемся в Key Collector: вкладка «Данные» → «Минус-слова». Нажимаем «+», добавляем слова в открывшееся окно и сохраняем.

Вкладка Минус-слова
Добавление минус-слов

Нажимаем «Показать найденные фразы», проверяем по подсветке, что всё верно, выбираем фразы чек-боксом и нажимаем «Удалить фразы».

Показать найденные фразы
Проверка подсветки и удаление

Удаление неявных дублей

Неявные дубли — это две фразы из одного набора слов в разном порядке: «цветная капуста» и «капуста цветная» — дубли, а «капуста цветная» и «капуста цветная свежая» — нет. Их нужно удалять: по сути это одна фраза, и при фразовом или широком соответствии они и так покажутся. Если используете точное соответствие с фиксированным порядком слов — чистить дубли не обязательно.

01 Сначала выберите группы в «мультигруппу» (Shift — все подряд, Ctrl — выборочно). Затем вкладка «Главная» → пункт «Неявные дубли».

Пункт «Неявные дубли»
Выделение групп перед поиском дублей

02 В открывшемся окне проверьте настройки и нажмите «Найти». Когда программа отработает, откроется вкладка с результатами поиска дублей.

Настройки поиска дублей
Результаты поиска дублей

03 Настройте «Умную отметку» (стрелка рядом с кнопкой): сначала выберите «Отметить все фразы кроме имеющих максимальное числовое значение», источник данных — «База», сохраните.

Параметры умной отметки
Отметка кроме максимального значения

04 Нажмите «Умная отметка» ещё раз, чтобы фразы отметились, затем «Применить изменения».

Применение изменений

05 Перейдите на основную вкладку «Ключевые фразы» → «Главная» → «Удалить фразы».

Удаление отмеченных фраз

06 Запустите поиск дублей ещё раз. Теперь в параметрах выберите «Отметить все фразы кроме одной для каждой подгруппы с одинаковым числовым значением (случайный выбор)», источник — «База». Повторите отметку и удаление.

Второй проход умной отметки

07 Третий проход: «Отметить все фразы кроме одной в каждой подгруппе (случайный выбор)» — и снова удалите фразы.

Третий проход умной отметки

После этого неявных дублей остаться не должно — при повторном поиске вы получите такое уведомление. Соблюдать именно такой порядок важно, чтобы при случайном выборе не удалить нужные фразы.

Дубли не найдены

Чистка и кластеризация запросов

После сбора минус-слов и удаления дублей всё же могут затесаться ненужные фразы — перепроверьте каждую группу. Для рекламы старайтесь оставлять максимально коммерческие фразы (с приставками «купить», «заказать», «цена» и т.д.).

01 Просматриваем запросы, удаляем ненужные или добавляем их в минус-слова.

Просмотр и чистка запросов

02 Кластеризация — распределение запросов по группам по смыслу: «купить автомобиль» и «купить мерседес» — в разные группы. Хороший тон — до 15–20 запросов в группе. Новые группы создаются плюсом в рабочей области справа; называйте их понятно (например, «купить-пежо»).

Создание групп для кластеризации

03 Используйте поиск сверху, чтобы найти нужные фразы. Выделите их, щёлкните правой кнопкой → «Копировать/перенести фразы в группы» и выберите группу. Фильтр потом можно снять отдельной кнопкой.

Перенос фраз в группы
Снятие фильтра

04 Чистим запросы по частоте: для рекламы берём то, что реально ищут — рекомендуем от 10 запросов в месяц. Чтобы скрыть пустые столбцы, используйте «Волшебную палочку».

Волшебная палочка — скрыть пустые столбцы

05 Выберите фильтр рядом со столбцом «База» и выставьте «меньше 10» (или другое значение — зависит от собранной семантики).

Фильтр по частоте
Настройка условия фильтра

06 Выделите отфильтрованные фразы и нажмите «Удалить фразы».

Удаление низкочастотных фраз

Помните: пороговая частота зависит от тематики. В узкоспециализированных нишах частота до 10 — нормально, а где-то и 20 слишком узко. Смотрите по уже собранному ядру.

Выгрузка итогового файла и файла минус-слов

Последний этап — выгружаем результаты работы.

01 Ключевые слова: сверху слева «Файл» → «Экспорт» → «Фразы и статистика». Сохранится Excel-файл с фразами, группами и частотой — в таком виде уже можно отправлять клиенту на согласование.

Экспорт фраз и статистики

Мы обычно переносим фразы в Google Sheets — без частот и с понятными названиями столбцов, чтобы клиент мог быстро оставить комментарий. Пример такого файла:

Итоговый файл в Google Sheets

02 Минус-слова: на вкладке «Главная» нажмите кнопку «Минус-слова», затем «Сохранить в файл». Они сохранятся в текстовом формате — скопируйте их в Google Sheets на лист с минус-словами.

Кнопка Минус-слова
Сохранение минус-слов в файл

Семантика за минуты, а не за день

Wordstat DeepDive делает глубокий обход Вордстата, собирает минус-слова и выгружает готовый файл — без Key Collector и платных модулей.

Wordstat DeepDive

Не хотите возиться с семантикой сами? Соберём ядро и настроим рекламу под ключ — услуга Контекстная реклама.

Глубокий парсинг — это только сбор

После него ядро нужно почистить, сгруппировать и разнести по страницам — иначе тысячи запросов останутся таблицей. Мы делаем это как часть продвижения, а не отдельной услугой «сдать ядро».

SEO-продвижение сайтов · Как собрать семантику из Вордстата

Бесплатный SEO-аудит

[ FAQ ]

Частые вопросы

Чем парсинг отличается от простого сбора из Вордстата? +

Вордстат показывает верхний уровень запросов — то, что помещается на страницу. Парсинг проходит по дереву вглубь: берёт каждую найденную фразу и собирает её продолжения, повторяя цикл. На выходе получается на порядок больше низкочастотных запросов, где обычно и живёт дешёвый целевой трафик.

Как долго идёт парсинг большого ядра? +

От нескольких часов до нескольких суток — зависит от числа стартовых фраз, глубины обхода, количества потоков и качества прокси. Ускоряется это не увеличением потоков (упрётесь в блокировки), а грамотным подбором стартовых фраз и стоп-слов, отсекающих ненужные ветки до сбора.

[ АУДИТ ]

Хотите так же — но в своём проекте?

Бесплатно посмотрим вашу рекламу и аналитику и покажем, где теряются заявки. Без обязательств.

Больше — в нашем Telegram-канале

Кейсы, разборы и новости digital — без воды.