Парсер ключевых слов онлайн яндекс. Парсер ключевых слов

28.08.2023 | Хобби и развлечения

Скачать архив с парсером
Данный парсер собирает ключевые слова и частотность в эксель файл из сервиса яндекс wordstat.
Если в Ваших частых задачах присутсвует сбор статистики по ключевым словам из сервиса yandex водстат, то одним из способов оптимизации рабочего процесса - является делегирование парсеру задачу парсинга ключевых слов.
Данный парсер не является оригинальным в функциональности, но оригинален в простоте настроек и получения данных по ключевым словам.

Функциональность данного парсера позволяет собрать кллючевые слова из сервиса wordstat.yandex.ru , статистику запрашиваемости собранных ключей, точную частоту ключей, а так же разгруппировать на кластеры собранные ключи.

Настройки парсера:

1. Логин от yandex.ru - в данное поле необходимо ввести адрес Вашего почтового ящика от яндекс почты

2. Пароль от yandex.ru - в данное поле необходимо ввести пароль от Вашей почты на яндексе

3. Файл с ключевыми словами - в данное поле указывается файл со списком ключевых слов (файл должен быть сохранён в формате utf-8, каждый ключ с новой строки), если Вы планируете активировать кластеризацию запросов после сбора, то в данном файле должна находится только 1 базовая ключевая фраза (все слова только в нижнем регистре (маленькими буквами))

4. Файл с минус-словами - в данное поле указывается файл со списком минус-слов (файл должен быть сохранён в формате utf-8, каждое минус-слово с новой строки)

5. Глубина взятия - до какой глубины парсить

6. Исследовать результаты - данная опция активирует этап кластеризации запросов, после того, как будут собраны ключи по базовой фразе (активируя данную опцию Вы обязательно должны указать файл для сохранения исследования)

7. Проверять на точную частоту - данная опция активрует сбор точной частотки по собранным ключам

8. Глубокое сканирование - данная опция активирует глубокое сканирование

9. Ключ для капч - указывать необязательно

10. Файл для сохранения ключей - эксель файл, в который будут сохраняться ключевые слова из сервиса wordstat.yandex.ru

11. Файл для сохранения исследования - эксель файл, в который будут сохраненны сгруппированые кластеры после кластеризации

Если есть вопросы или пожелания - пишите на почту [email protected]
skype - vipvodu
Скачать архив с парсером

Пример файла с кластерами по ключу - база клиентов.

Советы:
1. Тщательно проверяйте настройки перед запуском.
2. Если программа, после нажатия на кнопку - запустить - выключается - то скорее всего, что-то не так с настройками, либо есть повисшие процессы после предыдущего прерванного парсинга, повисшие процессы надо либо убить в диспетчере задач, либо перезагрузить компьютер.
3. Не прерывайте парсинг, дожидайтесь надписи - Все данные сохранены

) Для работы парсера SE::Yandex::WordStat необходимы аккаунты Яндекс. Аккаунты можно зарегистрировать с помощью парсера или просто добавить существующие аккаунты в файл files/SE-Yandex/accounts.txt в формате:

[email protected];password
[email protected];password2
...
Нажмите, чтобы раскрыть...

Собираемые данные(top)

Количество показов по указанному запросу
Дату обновления статистики
Список всех кейвордов связанных с указанным и число их показов в месяц
Список всех дополнительных кейвордов которые искали пользователи и число их показов в месяц

Возможности(top)

Парсит максимальное отдаваемое вордстатом число результатов - 40 страниц по 50 элементов выдачи
Поддерживает выбор региона поиска(с подгруппами)
Может автоматически подставлять найденные кейворды заново в запросы(опция Parse to level)
Возможность выбора сразу нескольких регионов для оценки
Возможность обхода каптчи с помощью сервиса AntiCaptcha или любого другого поддерживающего их API

Варианты использования(top)

Оценка количества трафика по кейворду(частота)
Поиск новых ключевых слов схожей тематики
Сбор больших баз ключевых слов разной тематики
Любые другие варианты подразумевающие парсинг Яндекс.WordStat в том или ином виде

Запросы(top)

В качестве запросов необходимо указывать ключевые слова, точно так же как если бы их вводили прямо в форму поиска Вордстата, например:

окна москва
"окна москва"
!окна!москва
Нажмите, чтобы раскрыть...

Результаты(top)

В результате отображен исходный запрос, число его показов, дата обновления статистики, список связанных кейвордов и их показы в месяц, список дополнительных кейвордов и их показы в месяц

Окна!москва - 10368, updated: 16/05/2013
keywords:
окна москва: 32367
пластиковые окна москва: 8994
окна пвх москва: 4813
купить окна москва: 2561
окна цены москва: 1706
москва работа окна: 1547
вакансии окна москва: 1187
деревянные окна москва: 1087
служба +одного окна москва: 1021
...
additional keywords:
производство окон пвх: 8512
окна rehau: 15686
окна salamander: 1576
окна kbe: 3798
окна кбе: 6089
окна кве: 3227
остекление балконов: 83216
беседки: 471213
остекление лоджий: 26366
офисные перегородки: 18740
монтаж окон: 26223
...
Нажмите, чтобы раскрыть...

Возможные настройки(top)

Параметр	Значение по умолчанию	Описание
Pages count	10	Количество страниц для парсинга
Region	All	Регион поиска
Remove + from keywords	☐	Удалять символ плюса (+) из найденных запросов
Use AntiGate	☐	Определяет использовать ли AntiGate для обхода каптч
AntiGate preset	default	Необходимо предварительно настроить парсер Util::AntiGate - указать свой ключ доступа и другие параметры, после чего выбрать созданный пресет здесь
AntiGate preset for Login	default	Пресет AntiGate для логина. Необходимо предварительно настроить парсер Util::AntiGate с параметрами, после чего выбрать созданный пресет здесь
Use Accounts	☑
First sleep	50	Задержка после первого запроса при использовании AntiGate для экономии каптч
Use session	☑	Сохраняет хорошие сессии для дальнейшего использования
Mobile only	☐	Получать статистику только для мобильного трафика
Remove bad accounts	☑	Автоматическое удаление аккаунтов с неверным логин/паролем или требующих подтверждения по телефону

Парсер ключевых слов — это настройка Datacol, которая автоматически собирает запросы из статистики сервиса Wordstat по заданным пользователем ключевым словам. Таким образом, вам необходимо всего лишь задать базовые ключевые слова, после чего Datacol самостоятельно соберет информацию по производным запросам. Наряду с запросами сохраняется частота показов каждого запроса в месяц. При парсинге Datacol проходит по всем страницам выдачи Wordstat.

С помощью парсера Wordstat Вы сможете собрать запросы и частоту показа из статистики;
Вам нужно указать только список ключевых слов, данные по которым Вам необходимо собрать;
Сохраняйте собранную информацию в любом удобном формате (Excel, TXT, WordPress, MySQL и т. д.).

Парсинг Wordstat подразумевает обработку Javascript, а также необходимость авторизации для сбора данных. Такую возможность мы получаем благодаря плагину . При запуске кампании Datacol откроет один или более экземпляров браузера Chrome для загрузки через них вебстраниц. Количество работающих экземпляров Chrome равно количеству потоков кампании. Обратите внимание, что инициализация экземпляров браузеров может занять некоторое время.

Кем и для чего используется парсер ключевых слов яндекса

Парсер ключевых слов чаще всего используется специалистами по поисковому продвижению сайтов. В частности, это касается реализации задачи составления семантического ядра сайта. Оговоримся, что ниже речь пойдет о продвижении сайтов в рунете. В данном контексте более актуален парсер ключевых слов яндекс директа.

Парсер поисковых запросов директа

Для начала опишем стандартную схему работы парсера директа.

1. Пользователь задает поисковые запросы, производные которых необходимо собрать.
2. Парсер авторизуется на яндексе и начинает парсить яндекс вордстат поочередно для каждого запроса.
3. Для каждого запроса получаются производные ключевые слова не только с первой страницы выдачи директа, но и со всех последующих.

В результате на выходе мы имеем достаточно большое количество вариантов ключевых слов, которые в дальнейшем используются для формирования семантического ядра сайта.

Парсер ключевиков и количества показов — “скользкий момент”

Отметим, что помимо ключевых слов мы получаем так называемое “прогнозируемое количество показов” — показатель к которому стоит относиться очень осторожно. Для начала разберемся, что об этом значении пишет сам Яндекс:

В результатах выводится статистика запросов поисковой системы Яндекс, содержащих заданное слово или словосочетание, и других запросов, которые осуществляли искавшие его люди (справа).
Цифры рядом с каждым запросом в результатах выдачи вордстат дают предварительный прогноз числа показов в месяц, которое вы будете иметь, выбрав данный запрос в качестве ключевого слова.

Ошибкой многих оптимизаторов является то, что они читают только первую часть описания, и при этом — читают не совсем внимательно. Идем дальше:

Цифра рядом со словом «телевизор» обозначает число показов по абсолютно всем запросам, включающим слово «телевизор»: «купить телевизор» , «плазменный телевизор», «купить плазменный телевизор», «купить новый плазменный телевизор» и т.п.

Вы уже наверное догадались, на что мы намекаем? Итак, вы должны понять главное — при парсинге производных запросов по Wordstat не стоит обращать внимание на показатель их частотности, поскольку данное значение суммируется из частотностей всех производных запросов.

Но как в таком случае определить какие ключевики более “жирные” а какие менее? Сразу развенчаем ошибочное мнение, что производные ключевики всегда имеют меньше реальных показов, что основные. Это откровенная чушь! Найти реальные количества показов ключевиков (с вычетом количества показов производных) нам позволит операторы кавычки. Таким образом, для поиска запросов и определения самых “жирных” необходимо применять следующую схему:

1. Запустить парсер ключей для поиска производных.
2. Взять все производные запросы и отпарсить количество показов каждого, задавая запрос в кавычках.

Мы согласны, что это несколько более длинный и сложный путь. Однако представьте ситуацию. У вас есть около 500 запросов, по которым вы хотите продвинуть основной сайт. 30 из них являются (по вашему первоначальному мнению, то есть по изначально спарсенной статистике Wordstat) наиболее высокочастотными. Далее вы тратите 3 месяца времени и несколько тысяч убитых енотов (да ребята — качественное продвижение это дорогостоящее и длительное мероприятие) и в итоге оказывается, что поискового трафика в несколько раз меньше чем ожидалось. Вы сильно расстраиваетесь, ищите профессионального специалиста по продвижению и он вам открывает глаза на то, что вы продвигали совсем не те запросы, которые приводят трафик (в частности, он показывает вам реальную статистику по запросам в кавычках).

Тестирование парсера запросов

На нашем сайте вы можете бесплатно скачать парсер ключевых слов яндекса и протестировать его. Мы также можем обсудить настройку парсера кеев, которая будет проверять значения собранных запросов в кавычках.

Тестирование парсера Wordstat

Чтобы протестировать работу парсера Wordstat :

Шаг 1. Установите . Демо-версия программы имеет все возможности платной, но сохраняет только первые 25 результатов парсинга.

Шаг 2. В дереве кампаний присутствует кампания seo-parsers/wordstat-keywords-parser.par . Выберите ее и нажмите кнопку Запуск (Play) . Перед запуском можно отредактировать Входные данные , чтобы изменить набор базовых запросов , по которым будет собираться статистика.

кликните на изображении для увеличения

После запуска кампании открывается окно браузера, в которое необходимо ввести авторизационные данные для доступа к статистике Wordstat.

Один из наиболее популярных модулей в Rush Analytics – парсер Яндекс Вордстат, и это не случайно. При сборе семантического ядра необходимо точно знать частотность собранных запросов, чтобы правильно расставить приоритеты по продвижению и избавится от «мусорных» и нулевых запросов. Часто стоит задача пробить несколько десятков тысяч запросов на частотность в Яндексе, но это не совсем простая задача для самописных парсеров Вордстата и десктопных программ, и вот почему:

Yandex Wordstat имеет хорошую защиту от парсинга, например бан IP-адресов с которых осуществляется парсинг и выбрасывание капчи в ответ на запросы от ботов. Чтобы эффективно собирать данные с Wordstat, нужен эффективный алгоритм подключения IP-адресов и другие хитрости
Для парсинга большого количества данных с помощью десктопных программ понадобится много IP-адресов (прокси), которые Яндекс с легкостью банит при неоптимальном алгоритме подключения, а прокси – удовольствие недешевое
Так же для парсинга понадобится автоматическое введение большого количества капчи (например подключение Antigate для этой задачи). Данный фактор, при неоптимальном алгоритме парсинга, может сделать сам парсинг нерентабельным, так как стоимость капчи будет чрезмерно высока
Большинство десктопных программ не имеют защиты от потери данных при сборе. Так, например, собрав половину данных и потратив на это деньги, при сбое в парсере, вы рискуете не только не получить оставшиеся данные, но и потерять уже собранные

Парсинг Яндекс Вордстат в Rush Analytics

Учитывая все трудности которые могут возникнуть при парсинге Вордстата, мы сделали свой парсер Wordstat максимально быстрым, удобным и устойчивым к максимальному количеству проблем, связанных с парсингом:

Никаких прокси и капчи! Вам больше не нужно думать о бане ваших прокси или огромном количестве капчи, которую выдает Яндекс. Просто создайте проект, загрузите ключевые слова и ждите готовый файл с результатом
Высокая скорость парсинга. Наши алгоритмы используют оптимальную схему подключения IP-адресов и другие хитрости, чтобы сделать скорость парсинга феноменально высокой – вы и не заметите, как ваш проект будет выполнен!
Сохранность данных. Создавая проект в нашем парсере, вы можете быть уверены, что он будет успешно завершен и доступен для скачивания в любое время и из любой точки мира – все данные хранятся в облаке!
Поддержка всех регионов Яндекса. У многих пользователей есть потребность определять частотность запросов в Яндексе не только по региону «Москва» или «Россия», но и по другим, включая «Украину» и «Беларусь». В Rush Analytics вы сможете определить частотность запросов по любому региону, который поддерживает Яндекс на данный момент.

Сбор всех частотностей. С помощью нашего парсера вы сможете собрать все частотности: поисковый запрос, «поисковый запрос», «!поисковый!запрос».

Сбор левой колонки Wordstat. Помимо проверки частотности запросов, доступен сбор ключевых слов из левой колонки Wordstat с настройкой глубины парсинга от одной страницы до сбора всех имеющих в левой колонке страниц.

Сбор правой колонки Wordstat. Доступен сбор ключевых слов из правой колонки Wordstat.

Если вам нужен скоростной сбор частотностей Яндекс Wordstat – Rush Analytics лучшее решение, особенно если вам нужно собирать большие объемы данных. Для пользователей с потребностью сбора боле 100 000 запросов в месяц предусмотрены индивидуальные условия, просто напишите в нашу поддержку на

Простой и бесплатный пример PHP парсера (parser) статистики ключевых слов с wordstat Яндекс.

Понятно, что перед тем как продвигать сайт, нужно определиться с ключевиками. это не сложный, но кропотливый труд. Для того же чтоб найти что-то стоящее, нужно перелопатить кучу данных. Поэтому здесь не обойтись без средств автоматизации процесса. В данной заметке я хочу остановиться на создании PHP парсера данных с wordstat Яндекс.

И так. Основная проблема при парсинге данных с сервиса статистики ключевых слов wordstat Яндекс заключается в наличии капчи. Обойти ее не так уж и сложно. Достаточно передать в запросе куку fuid01, генерируемую при обработки капчи. Другими словами, вам понадобится зайти на сервис, сделать запрос, указав символы с картинки и получить содержание требуемой куки.

Как получить содержание куки fuid01 в браузере Firefox?

Т.к. я не собираюсь замахиваться на эпосы и прочие великие труды человечества, то опишу лишь процесс получения содержания куки fuid01 в браузере Firefox (использую версию 8.0). В общем, запускаем Firefox. Считаем, что запрос в wordstat уже сделан и кука создана. Жмем кнопку «Firefox» в левом верхнем углу окна браузера. В меню выбираем: Настройки > Настройки (я ничего не путаю).

В открывшемся окне «Настройки», переходим на вкладку «Приватность». Здесь нас интересует блок «История». Выбираем в списке Firefox «будет использовать ваши настройки хранения истории» и жмем появившуюся кнопку «Показать куки…».

В окне «Куки», в поле «Поиск» введите имя интересующей нас куки, т.е. «fuid01». В списке должно отобразиться найденное. Выберите одну из предложенных кук и в поле информации, выделите и скопируйте ее «Содержимое».

Как работать с PHP парсером wordstat Яндекс

Бесплатно скачать PHP парсер wordstat Яндекс можно здесь . Сразу скажу, что это лишь пример, работа которого заключается в парсинге ключевых слов и выводе их на экран, но все по порядку.

Первое, что вам надо понять – все данные представлены в кодировке UTF-8. Так что если что не забудьте сконвертировать данные. Более того, на некоторых серверах с этим может возникнуть проблема, подробней . Следующий нюанс заключается в том, что для работы скрипта понадобится поддержка . В остальном все достаточно просто.

Содержание куки fuid01 мы присваиваем переменной $fuid01 . По сути, это значение задается в curl_setopt() через CURLOPT_COOKIE , но для удобства я вывел его отдельно. Далее нас интересует массив $params — это переменные, передаваемые в запросе к wordstat Яндекс. В качестве примера я ограничился простейшим вариантом, так что обошлось без динамики. В частности, парсится только первая страница выдачи: "page" => 1 , значение text получается через GET, ну а для региона выбрана Москва : "geo" => 1 .

Понятно, что идентификатор региона, в случае если нужен другой, придется уточнять. Для этого заходим на wordstat Яндекс, кликаем ссылку «Уточнить регион…» и выбираем требуемое.

Сделав запрос, в URL надо посмотреть значение требуемого параметра. Следует отметить, что если выбрано более одного региона, их идентификаторы будут перечислены через запятую.

Дальше идет запрос к сервису статистики и парсинг данных wordstat Яндекс. Последнее имеет один небольшой нюанс. Дело в том, что wordstat Яндекс выводит статистику в виде двух таблиц: «что искали со словом…» и «что еще искали люди, искавшие…» — я же использовал только первую. Впрочем, там нет ничего сложного. Регулярные выражения достаточно простые. Думаю, разберетесь. Удачи!