1. Внимание! Чтобы создавать темы на форуме необходимо написать минимум 10 сообщений!
    Скрыть объявление

A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc

Тема в разделе "Поисковые системы и SEO", создана пользователем A-Parser Support, 12 янв 2017.

  1. Для просмотра ссылки войдите или зарегистрируйтесь!
    7-й сборник статей. В нем мы научимся сохранять результаты в виде Excel файлов, продолжим изучение работы через API, а также ознакомимся с 5-ю способами автоматизации последовательного выполнения нескольких заданий. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Вывод результатов в виде xlsx файлов (стандартный формат Excel) - это очень популярный вопрос среди пользователей A-Parser. Ранее такой возможности не было, но с добавлением поддержки Node.js модулей это стало возможным. Поэтому мы публикуем статью, в которой показан реальный пример парсинга с сохранением в Excel. Ознакомиться со всеми подробностями можно по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Это вторая часть из цикла статей по работе с A-Parser через API. В ней на примере парсинга e-mail будет рассмотрен метод addTask. Все детали - по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Очень часто возникают задачи, решение которых требует использования возможностей сразу нескольких разных парсеров и при этом результаты работы одного нужно передавать в следующий. А-Парсер - это очень гибкий инструмент, поэтому существует сразу несколько способов, как автоматизировать последовательное выполнение нескольких заданий, при этом максимально автоматизируя работу и повышая производительность. Описание всех возможных методов читайте в обзоре по ссылке выше.

    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь Для просмотра ссылки войдите или зарегистрируйтесь!.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  2. Для просмотра ссылки войдите или зарегистрируйтесь!
    Вторая часть из цикла уроков о работе с API A-Parser. В видео на реальных примерах показана работа с методами addTask, getTaskState, getTaskConf и getTaskResultsFile.



    В этом уроке рассмотрены:
    • методы API для постановки длительных задач, а также для просмотра информации о задании
    • составление JSON для используемых API запросов
    • функция Получить API запрос
    • демонстрация работы с API, используя Postman
    Документация по API: Для просмотра ссылки войдите или зарегистрируйтесь!

    Также рекомендуем статью с несколькими интересными кейсами использования A-Parser от руководителя оптимизаторов в «Ашманов и партнёры» Никиты Тарасова: Для просмотра ссылки войдите или зарегистрируйтесь!

    Оставляйте комментарии и Для просмотра ссылки войдите или зарегистрируйтесь!
     
  3. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Начиная с версии 1.2.455 мы начинаем официальную поддержку Node.JS модуля puppeteer - средства автоматизации работы с браузером Chrome(Chromium), благодаря чему возможен полноценный рендеринг DOM с поддержкой JS. В качестве примера мы выкладываем парсер, который делает скриншоты сайтов в формате PNG, доступен выбор размера скриншота. Chromium может быть запущен как на Windows, так и на Linux серверах без GUI.
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    Улучшения
    • [​IMG] Для просмотра ссылки войдите или зарегистрируйтесь! полностью переписан, добавлен сбор дополнительных данных, а также в настройках добавлен выбор региона и языка интерфейса
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлены все методы в настройки, а также реализована возможность переопределения через заголовок Method
    • Добавлена возможность форматирования всех цифр в интерфейсе
    • JS парсеры: в this.parser.request для override добавлена опция needData, которая определяет передавать или нет в ответе data/pages[], может использоваться для оптимизации
    • JS парсеры: добавлена поддержка модулей url и ws

    Исправления в связи с изменениями в выдаче
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - не всегда корректно обрабатывалась доменная зона com.br
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!

    Исправления
    • Исправлена работа функции Bypass Cloudflare в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена ошибка, из-за которой при определенных настройках не писался Начальный текст
    • Исправлена работа некоторых socks4 прокси
    • Исправлена ошибка в $tools.base64.encode() при работе с кириллическими символами
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлена ошибка, при которой игнорировался домен
    • JS парсеры: исправлена редкая ошибка в работе сокетов в Node.js
     
  4. Для просмотра ссылки войдите или зарегистрируйтесь!
    31-й сборник рецептов. В нем будет показан способ создания скриншотов веб-страниц, парсинг подсказок Яндекс Маркета, а также проверка правописания в Google. Кроме этого, только до конца апреля доступна возможность купить XEvil со скидкой. Далее обо всем по порядку.

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Для всех существующих и новых пользователей A-Parser действует скидка на покупку XEvil -50%!
    XEvil - это простая, быстрая и удобная программа для полностью автоматического распознавания и обхода подавляющего числа капч и рекапч, без необходимости подключения каких-либо сторонних сервисов. Использование XEvil в связке с A-Parser позволяет значительно удешевить парсинг ресурсов, где необходимо разгадывать капчи/рекапчи, при этом практически не теряя в скорости.
    Акция действует до конца апреля. Количество промокодов ограничено, поэтому не упустите возможность воспользоваться скидкой!
    Для получения промокода на покупку XEvil пишите в тикеты.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Возможность загружать страницы с полной обработкой всех скриптов, аналогично браузеру - это один из самых популярных фичреквестов для A-Parser. Поэтому буквально недавно была добавлена поддержка Node.js модуля puppeteer, с помощью которого теперь можно получать полностью отрендеренные страницы. И мы публикуем первый пример по работе с ним - парсер для создания скриншотов веб-страниц. Больше информации, пример работы и готовый парсер - все это доступно по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Еще один парсер подсказок, на этот раз из Яндекс Маркета. Собираются подсказки, их популярность (частота), тип, а также, опционально, категория (включая полный путь родительских категорий). Готовый парсер, как обычно, доступен в нашем Каталоге по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Данный парсер позволяет проверить ключевые слова через поиск Google на предмет опечаток и получить исправленные варианты. Готовый пресет доступен по ссылке выше.
    [​IMG]

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!
    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  5. Для просмотра ссылки войдите или зарегистрируйтесь!
    Видеоурок по работе с MySQL в A-Parser. В нем на реальном примере показано как работать с базами данных MySQL, используя Node.js модуль mysql2.



    В этом уроке рассмотрены:
    • Установка и подключение модулей
    • Некоторые основы языка запросов SQL
    • Создание базы данных MySQL
    • Получение и запись данных в БД, используя JS-парсеры

    Полезные ссылки:
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!

    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!
     
  6. Для просмотра ссылки войдите или зарегистрируйтесь!

    32-й сборник рецептов, в котором подобраны 3 JS парсера для парсинга Yahoo Answers, оценки ключевых слов и сбора контактных данных фрилансеров.

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Полноценный парсер сервиса Yahoo Answers, который по ключевым словам позволяет собирать непосредственно вопросы, ответы, а также их категории, дату создания и ссылки на страницы обсуждений.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Парсер, который ищет по ключевым словам фрилансеров и собирает их контакты. Данные собираются с сервиса fl.ru.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Парсер для сервиса seranking.com. Кейворды оцениваются по 4-м показателям: частотность, стоимость клика (CPC), стоимость трафика и KEI. Также есть возможность собирать похожие, релевантные и подсказки к начальному запросу вместе с их показателями.
    [​IMG]

    Еще больше различных рецептов в Для просмотра ссылки войдите или зарегистрируйтесь!
    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  7. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Новые парсеры:
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - по ключевым словам собирает различные данные об организациях в заданных координатах
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - по ключевым словам собирает различные данные об организациях в заданных координатах
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - сбор ключевых слов по домену
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - сбор ключевых слов по домену
    • Удалены 4 неактуальных парсера: Rank::SEMrush::Keyword, SE::QIP, SE::QIP::position, Rank::MegaIndex
    • Улучшена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • JS парсеры: для this.request добавлена опция data_as_buffer, которая определяет возвращать data как строку(String) или объект Buffer

    Исправления в связи с изменениями в выдаче
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлена работа с рекаптчами, исправлен парсинг сниппетов, а также исправлен парсинг мобильной выдачи
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! полностью переписан, также полностью изменился список собираемых данных, парсер возвращает только те данные, которые доступны без авторизации
    • Полностью переписан [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, теперь обязательно требуется установка Node.js и модуля brotli
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! удалена переменная $facebook_share в связи с прекращением поддержки со стороны FB
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! , [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!

    Исправления
    • Исправлена работа с запросами, содержащими пробел в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена проблема с декомпресией данных на некоторых сайтах
    • JS парсеры: исправлена работа setImmediate
     
  8. Для просмотра ссылки войдите или зарегистрируйтесь!
    В этом видеоуроке будет показано, как настроить периодическую проверку окончания срока регистрации доменов, и получать уведомления в телеграм, если он меньше заданного количества дней.

    В уроке рассмотрено:
    • использование tools.js для написания собственных функций
    • работа с шаблонизатором Template Toolkit
    • проверка доменов через WHOIS
    • цепочки заданий
    • отправка сообщений в Telegram с помощью бота
    Полезные ссылки:
    • Для просмотра ссылки войдите или зарегистрируйтесь! - статья о создании бота и группы для получения уведомлений в Telegram
    • Для просмотра ссылки войдите или зарегистрируйтесь! - видеоурок по созданию Телеграм канала на базе A-Parser
    • Для просмотра ссылки войдите или зарегистрируйтесь! - готовые для импорта пресеты
    • Для просмотра ссылки войдите или зарегистрируйтесь! - документация по Telegram Bot API
    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  9. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Движок v8 обновлен до версии 7.5, помимо увеличения скорости есть множество улучшений в поддержке новых возможностей языка JavaScript
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! в массив $ads добавлена переменная $visiblelink, в которой содержится видимая ссылка
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлена переменная $totalcount которая содержит количество результатов
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлена опция Not found is error, указывающая, считать ли отсутствие результатов ошибкой

    Исправления в связи с изменениями в выдаче
    • Исправлен парсинг $title в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлен парсинг видео в мобильной выдаче
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлен парсинг рейтингов
    • Исправлена проверка получаемого контента в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]SE:: DuckDuckGo::Images
    Исправления
    • Исправлена редкая проблема с ошибками в JS парсерах на Windows
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!исправлена работа функции Get full links для результатов без ссылок
    • Исправлена проблема с Decode JSON error в парсерах WordStat
    • Исправлен баг с перезагрузкой кода JS парсера при редактировании в сторонних приложениях, проблема возникла в одной из предыдущих версий
    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  10. Для просмотра ссылки войдите или зарегистрируйтесь!
    33-й сборник рецептов, в котором мы будем собирать данные из Google maps в указанной местности, спарсим блок вопросов и ответов в поиске Гугла и научимся использовать файлы целиком в качестве запросов. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Начиная с версии 1.2.482 в A-Parser появились парсеры карт Google и Яндекс. Принцип работы обоих одинаков - в настройках указываются координаты точки и зум, парсер собирает результаты поиска по ключевым словам в этой точке и области вокруг нее, ограниченной зумом. Но если стоит задача собрать данные, например, со всего города, то для ее решения нужно указывать диапазон координат и "заставить" парсер пройтись по ним. Как это сделать, а также пример пресета - все это показано по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Google по некоторым запросам показывает в поисковой выдаче блок вопросов и ответов People also ask (Похожие запросы). Наши пользователи периодически интересуются, как можно парсить этот блок, получая отдельно вопросы и ответы на них. Поэтому мы публикуем в нашем каталоге пример такого парсера, а забрать его можно по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Общеизвестно, что в А-Парсере каждая строка в исходном файле - это отдельный запрос. Но существуют задачи, когда необходимо использовать все содержимое файла как один запрос, игнорируя разбивку на строки. Благодаря JavaScript парсерам такая возможность есть и по ссылке выше опубликован пример парсера, который получает все содержимое файла, переводит его на заданный язык и сохраняет в новый файл.
    [​IMG]

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!
    Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  11. Для просмотра ссылки войдите или зарегистрируйтесь!
    В этом видеоуроке мы изучим один из инструментов для работы с запросами - макросы подстановок. С их помощью можно значительно увеличивать количество запросов, листать страницы и многое другое.

    В уроке рассмотрено:
    • макрос {num} на примерах прохода по страницам и перебора координат в парсере Google maps
    • макрос {az} на примере парсинга по доркам для увеличения кол-ва запросов и соответственно результатов
    • макрос {each} на примере парсинга подсказок для генерации словосочетаний

    Полезные ссылки:
    • Для просмотра ссылки войдите или зарегистрируйтесь! - документация по макросам подстановок
    • Для просмотра ссылки войдите или зарегистрируйтесь! - пресет по перебору координат в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь! - пресет для парсинга с inurl:
    • Для просмотра ссылки войдите или зарегистрируйтесь! - пресет для парсинга подсказок

    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  12. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлено 4 новых парсера Instagram
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг данных о постах, в т.ч. комментарии и пользователей, которые лайкнули пост
      • [​IMG] Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг данных о профилях и списка постов
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг постов по тегах
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг постов в определенной локации
    • Добавлено 2 новых парсера SerpStat
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг данных по ключевому слову
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсинг данных по доменам/ссылкам
    • Добавлена поддержка дробных чисел в макросе подстановок {num}
    • Добавлена поддержка Node.js в tools.js, теперь можно использовать возможности Node.js (включая модули) в обычных пресетах во всех полях кроме Parse custom results, фильтров и Конструкторов результатов
    • Шаблоны Template Toolkit в настройках парсеров теперь работают для всех запросов
    • Стабилизирована работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! после изменений со стороны Google, благодаря чему несколько уменьшилось количество рекаптч
    • Улучшена проверка ответа в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, улучшен сбор картинок, а также добавлена возможность собирать ссылки на страницу организации
    • API: для oneRequest/bulkRequest добавлен параметр needData, указывающий, передавать ли в ответе data/pages, используется для экономии памяти, по умолчанию отключен
    • Обновлены apps.json и user-agents.txt, при установке обновления также рекомендуется обновить эти файлы
    Исправления в связи с изменениями в выдаче
    • Исправлена ситуация, при которой в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! выдавался 597 код ответа
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлена ситуация, при которой в результатах появлялись "пустые" ссылки, а также исправлен парсинг сниппетов в мобильной выдаче
    • Исправлена редко встречающаяся проблема с [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, когда парсер получал в ответ 403 статус
    • Исправлено определение языка запроса в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, а также исправлен сбор $title
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! удалена переменная $linkedin_share в связи с прекращением поддержки со стороны LinkedIn
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлен парсинг $features для некоторых видов запросов
    • Исправлен урл запроса в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлен баг в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, из-за которого в некоторых случая парсинг завершался с ошибкой
    • В парсерах Maps::* исправлена работа с отрицательными координатами
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлена ошибка определения "удачности" запроса
    • Исправлен баг в tools.js, возникший после обновления V8
    • API: исправлена работа метода getAccountsCount
    • JS парсеры: исправлен баг со слэшем в check_content
    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  13. Для просмотра ссылки войдите или зарегистрируйтесь!
    8-й сборник статей. В нем мы научимся парсить ссылки с GET параметрами, искать в поиске Google и скачивать документы, а также узнаем как очищать очередь заданий через API. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    В техническую поддержку часто задают вопрос, как собирать ссылки с GET параметрами для поиска SQL уязвимостей. Поэтому, по ссылке выше мы расскажем как это сделать, используя стандартный парсер Google.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    За последнее время уже несколько раз появлялись новости о том, что Google индексирует пользовательские документы, размещенные в их одноименном сервисе и открытые для доступа по ссылке. Соответственно все эти файлы становятся доступны в поиске. И пока Google разбирается с этим, по ссылке выше мы рассказываем как можно искать и скачивать такие документы.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Третья и заключительная часть из цикла статей по работе с A-Parser через API. В ней на примере очистки очереди задач будет рассмотрена работа со вспомогательными запросами, которые позволяют работать с очередью заданий. Все детали - по ссылке выше.

    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь Для просмотра ссылки войдите или зарегистрируйтесь!.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  14. Для просмотра ссылки войдите или зарегистрируйтесь!

    34-й сборник рецептов, в котором опубликован пресет для оценки количества трафика на сайтах, парсер Ahrefs через API и пресет для парсинга информации об IP адресах. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Пресет для проверка трафика сайта через сервис siteworthtraffic.com. Собираются данные о количестве уникальных постетителей и просмотров, а также о доходе с рекламы. Оценка трафика на сайтах может быть полезна для фильтрации списка сайтов по критерию прибыльности и популярности. Пресет доступен по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Парсер для сбора данных из популярного сервиса Ahrefs через их официальное API. Собирается множество данных, которые позволяют оценивать домены по различным характеристикам. Для использования нужен API ключ, который приобретается отдельно.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Небольшой пресет для сбора информации об IP адресе, а именно: подсеть, организация, страна и город. Данные собираются из сервиса whoer.net.
    [​IMG]

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!
    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Для просмотра ссылки войдите или зарегистрируйтесь!

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  15. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлен новый парсер API::Server::Redis (только для лицензий Enterprise)
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлена возможность определять наличие расширенных сниппетов (rich snippets) в выдаче
    • В связи с изменениями на сервисе-источнике парсер SE::IxQuick был удален, а вместо него добавлен SE::Startpage с почти аналогичным функционалом
    • Улучшена логика работы функции Get full links в SE::Baidu SE::Baidu
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! реализована возможность указывать дополнительные заголовки для запросов
    • Улучшен парсинг меток сайтов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, а также добавлена поддержка новых типов меток
    • Улучшена логика работы функции Get full links в SE::Baidu
    • Оптимизирован алгоритм обработки подзапросов
    Исправления в связи с изменениями в выдаче
    • Улучшена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, в связи с тестированием новой верстки
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! переработан механизм повторных попыток, добавлена поддержка сессий
    • Исправлен парсинг сниппетов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Поностью переработан [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!- теперь он парсит только первую страницу результатов
    • Исправлен парсинг мобильной выдачи в SE::Google::Modern
    • Исправлена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! при отсутствии результатов
    • Исправлена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, парсер полностью переписан
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлена проблема, из-за которой в некоторых случаях при запросе через API возвращался пустой массив страниц
    • Исправлено падение скорости в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлен баг в оптимизации парсеров
    • Исправлено сохранение параметра Report period в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!исправлен сбор ссылок, если в них есть перенос строки
    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  16. Для просмотра ссылки войдите или зарегистрируйтесь!
    В этом видео уроке рассмотрен пример решения задачи по поиску страниц контактов у заданного списка сайтов. Также парсится тайтл и все это сохраняется в CSV файл.

    В уроке рассмотрено:
    • парсинг поиска Google для получения ссылки на страницу контактов
    • парсинг главной страницы сайта для получения title
    • использование инструмента $tools.CSVline для форматирования файла результата
    • пример правильного импорта в Excel
    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!!

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  17. Для просмотра ссылки войдите или зарегистрируйтесь!
    35-й сборник результатов, где мы будем собирать комментарии из Youtube, искать контакты (телефоны и почты) на сайтах, а также парсить японскую выдачу Yahoo. Поехали!
    Для просмотра ссылки войдите или зарегистрируйтесь!
    Представляем вашему вниманию JS парсер комментариев для видео на Youtube. С его помощью можно собирать тексты комментариев, а также информацию об авторах комментариев индивидуально для каждого видео. Также реализована возможность указывать количество страниц с комментарими, что позволяет при необходимости ограничить их сбор и тем самым увеличить скорость работы.
    [​IMG]

    Извлекаем телефоны, начинающиеся на 3 с помощью HTML::EmailExtractor
    Пресет, в котором показано, как с помощью HTML::EmailExtractor HTML::EmailExtractor собирать контакты со страниц сайтов. Данный пресет предназначен для сбора e-mail и телефонов, начинающихся с 3 (Украина), но при необходимости можно немного изменить регулярные выражения и собирать телефоны других стран.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    JS парсер для парсинга японской выдачи Yahoo. Используется домен search.yahoo.co.jp. Собираются ссылки, анкоры и сниппеты, а также есть возможность задать количество страниц для парсинга.
    [​IMG]

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!

    Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  18. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлен новый парсер Для просмотра ссылки войдите или зарегистрируйтесь!
    • Добавлен инструмент $tools.CSVline для простого создания CSV файлов
    • В связи с тестированием Гуглом новой верстки в поисковике, добавлена ее поддержка в Для просмотра ссылки войдите или зарегистрируйтесь!
    • В Для просмотра ссылки войдите или зарегистрируйтесь! в массив $serp добавлена переменная $amp, которая показывает, поддерживает ли страница AMP
    • В Для просмотра ссылки войдите или зарегистрируйтесь! в $serp.$i.label добавлена поддержка Турбо страниц, а также добавлен сбор типов меток сайтов
    • В Для просмотра ссылки войдите или зарегистрируйтесь! улучшена работа с редиректами, добавлена опция Follow common redirects
    • Теперь в Для просмотра ссылки войдите или зарегистрируйтесь! можно указать хост для используемого сервиса разгадывания, а также в Provider url можно указывать адреса через запятую (актуально для XEvil и CapMonster), парсер будет использовать каждый из них в случайном порядке
    • Увеличено количество результатов в парсерах Для просмотра ссылки войдите или зарегистрируйтесь!
    • Добавлена опция ограничения числа логов, с целью оптимизации использования дискового пространства
    • JS парсеры: улучшена пакетная обработка запросов
    Исправления в связи с изменениями в выдаче
    • В Для просмотра ссылки войдите или зарегистрируйтесь! исправлена ситуация, при которой для части результатов не собирались данные
    • Исправлен Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлена проблема с рядом парсеров, из-за которой они не работали, появилась в одной из предыдущих версий
    • Исправлена ошибка в Для просмотра ссылки войдите или зарегистрируйтесь!, из-за которой при отсутствующих значениях запрос завершался с ошибкой
    • Исправлен баг в Для просмотра ссылки войдите или зарегистрируйтесь!, из-за которого в некоторых случаях запросы завершались с ошибкой
    • Для парсеров Для просмотра ссылки войдите или зарегистрируйтесь! и Для просмотра ссылки войдите или зарегистрируйтесь! изменен перечень доступных переменных в связи с не совсем корректной работой в некоторых случаях
    Для просмотра ссылки войдите или зарегистрируйтесь!
     
  19. tavelerr

    tavelerr New Member

    Если парсить VK, то VK не забанит ?
     
  20. tavelerr

    tavelerr New Member

    Можно ли этим парсером спарсить в поисковиках по ключевым фразам ?