A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc

Тема в разделе "Поисковые системы и SEO", создана пользователем A-Parser Support, 12 янв 2017.

  1. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлен парсер [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - парсер Индекса качества сайта (Яндекс ИКС)
    • Оптимизирована работа Очереди заданий
    • Добавлена поддержка множества экзотических кодировок китайского языка
    • Добавлена опция Save as UTF-8 with BOM, которая решает проблему определения кодировки при открытии сформированного CSV в Excel
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! полностью переписан с использованием современного юзерагента
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! оптимизирован и переписан на JavaScript
    • Улучшена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления в связи с изменениями в выдаче
    • Исправлен парсинг мобильной выдачи в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлено определение опечаток в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! и [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена ситуация, при которой в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! в сниппеты могли попадать ненужные ссылки
    • Исправлен парсинг рекламы в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлен парсинг количества результатов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Удален SE::Yandex::TIC, т.к. больше не актуален
    • Исправлен [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! для некоторых доменных зон
    • Исправлена ошибка, при которой не импортировался пресет, если не установлены модули, используемые в нем
    • Исправлена кодировка при использовании fs.readdirSync в JS парсерах
     
  2. Для просмотра ссылки войдите или зарегистрируйтесь!
    В 5-м сборнике статей на реальном примере будет показано, как создать свой канал в Телеграме и полностью автоматизировать его наполнение контентом. Также мы продолжаем цикл статей по работе с OpenCart и во 2-й части будет рассмотрен вопрос массового добавления товаров. Как обычно, в каждой статье приложены готовые JS парсеры, используя которые, можно на реальных примерах изучить описанные методы и поэксперементировать с ними. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    В этой статье будет описан способ создания полноценного канала в Telegram c автоматизированным сбором контента и постингом сообщений через заданные интервалы. И конечно, все это на базе A-Parser. Все подробности, а также готовые пресеты - по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Мы продолжаем цикл статей о заливке товаров в интернет-магазин на базе OpenCart. Во второй части будет рассмотрено массовое добавление товара. Подробности, а также пример готового парсера - по ссылке выше.
    [​IMG]

    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь Для просмотра ссылки войдите или зарегистрируйтесь!.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Предыдущие сборники статей
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
     
  3. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлен новый парсер [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Добавлена совместимость с модулем mysql2 в JavaScript парсерах
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлена поддержка сервиса R.I.P.captcha
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! добавлена возможность выбора страны
    • Уменьшено потребление оперативной памяти, а также оптимизирована начальная загрузка, интерфейс теперь открывается быстрее
    • База регионов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! обновлена и значительно увеличена
    • Для всех стандартных парсеров, кроме тех, которые работают на основе [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, из настроек убраны Max body size и Use gzip
    • Улучшен [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления в связи с изменениями в выдаче
    • Исправлен парсинг рекламы в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлен парсинг в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! для регионов, отличных от российских
    • Полностью обновлен [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена проблема с загрузкой каптчи в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлен парсинг количества результатов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлена работа с прокси при получении каптчи в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • В очень редких случаях в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! могла возникать ошибка Content mismatch
    • Исправлен [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! при работе с .eu доменами
     
  4. Для просмотра ссылки войдите или зарегистрируйтесь!
    Это видео демонстрирует возможность создания полноценного Telegram канала на базе A-Parser. Парсер периодически и без вмешательства пользователя будет собирать контент и публиковать его на канале.

    В уроке рассмотрены:
    • Регистрация и настройка канала в Телеграм.
    • Последовательное выполнение нескольких заданий.
    • Сохранение промежуточных данных в базу SQLite с последующим чтением.
    • Настройка пресета для постинга сообщений в Telegram-канал.
    Статья с подробным описанием процесса создания: Для просмотра ссылки войдите или зарегистрируйтесь!
    Ссылки на готовые пресеты:
    Для просмотра ссылки войдите или зарегистрируйтесь!
    Для просмотра ссылки войдите или зарегистрируйтесь!
    Для просмотра ссылки войдите или зарегистрируйтесь!
    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!
     
  5. Для просмотра ссылки войдите или зарегистрируйтесь!
    26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.
    [​IMG]

    Кроме этого:
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!
    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  6. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Добавлено 2 новых парсера:
      • [​IMG] Для просмотра ссылки войдите или зарегистрируйтесь! - парсер картинок из DuckDuckGo
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!- парсер картинок из Dogpile
    • Полностью переписаны 2 парсера:
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - добавлены региональные настройки, поддержка рекаптчи, возможность задавать различные фильтры поиска и сбор анкоров, ссылок на страницу, ссылок на превью, а также типов изображений
      • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! - добавлен сбор ссылок на превью
    • Улучшена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, а также увеличено максимальное количество страниц в настройках
    • Улучшена работа [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, а также добавлена возможность парсить связанные ключевые слова
    • JS парсеры: оптимизирован вызов конструктора и init()
    • JS парсеры: добавлена поддержка async init()
    Исправления в связи с изменениями в выдаче
    • Исправлен парсинг анкоров в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлено указание региона в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлен проход по страницам
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!,[​IMG] Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлена утечка памяти при большом количестве попыток
    • Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
    • Исправлен парсинг различных параметров в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлено отображение русского языка (проблема появилась в предыдущей версии)
    • Исправлено зависание при работе [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! с антигейтом
    • JS парсеры: исправлена работа check_content
    • JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)
     
  7. Для просмотра ссылки войдите или зарегистрируйтесь!

    Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.



    В этом уроке показано:
    • краткое содержание предыдущей части
    • запуск созданного пресета
    • демонстрация результатов работы
    Первая часть: Для просмотра ссылки войдите или зарегистрируйтесь!
    Статья и готовый пресет опубликованы в нашем Каталоге: Для просмотра ссылки войдите или зарегистрируйтесь!
    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!!
     
  8. Для просмотра ссылки войдите или зарегистрируйтесь!
     
  9. Для просмотра ссылки войдите или зарегистрируйтесь!
    27-й сборник рецептов. В нем собраны рецепты для парсинга списка соискателей на hh.ru, сбора списка юзерагентов и парсинга Авито с записью результатов в MySQL базу данных. Также показан пример отправки файлов в POST запросе. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    HeadHunter - это один из самых популярных ресурсов для поиска работы. Соответственно, сбор списка соискателей может быть интересен рекрутерам для более эффективного анализа потенциальных кандидатов. Готовое решение для парсинга доступно по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Сейчас существует много различных браузеров, которые работают на разных платформах. Многие сайты ограничивают работу со старыми браузерами, а некоторые не отдают контент даже при запросе с юзерагентом относительно нового браузера. В A-Parser можно задавать user-agent для запросов, также существует специальный инструмент, который позволяет при каждом запросе выбирать рандомный из заранее подготовленного списка. Пресет для парсинга таких списков, с возможностью фильтрации по различным параметрам, доступен по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Предыдущий пресет для парсинга Авито пользуется большой популярностью. Также наши пользователи часто спрашивают о возможности записи собранных результатов напрямую в базу данных. Поэтому мы подготовили JS парсер, который решает эту задачу. Как обычно, он доступен по ссылке выше.
    [​IMG]

    Кроме этого:
    • Для просмотра ссылки войдите или зарегистрируйтесь! - пример решения задачи по отправке файлов в POST запросах.

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!

    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  10. Для просмотра ссылки войдите или зарегистрируйтесь!
    В данном видео будет сделан краткий обзор некоторых методов API.

    В этом уроке рассмотрены:
    • обзор методов
    • составление JSON для методов ping,info и oneRequest
    • работа с API используя Postman
    Оставляйте комментарии и подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!
     
  11. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    уходящем году одним из приоритетных направлений стало развитие JavaScript парсеров и функционала по работе с Node.js. Одним из финальных этапов стал данный релиз, в котором была реализована долгожданная поддержка https/tls в Node.js модулях. Также усилия были сосредоточены на повышении стабильности и производительности. В результате этого было сделано множество наработок, которые уже в первой половине 2019 года планируется выпустить в виде нового A-Parser 2.0, где будет много новых и крутых возможностей.
    Команда A-Parser поздравляет всех с Новым годом и Рождеством! Мы желаем вам успехов в делах, прибыльных проектов и ярких идей. Пускай Новый 2019 год будет годом новых возможностей, все задуманное сбывается, а работа приносит удовольствие!
    Спасибо что Вы с нами!!!
    В новогоднем релизе, кроме снеговика:), было сделано следующее:
    Улучшения

    • Добавлена поддержка https/tls в Node.js модулях, что позволяет использовать все модули, которые работают с API по https, а также по TLSSocket (smtp и т.п.)
    • Полностью переписан и обновлен [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, добавлена возможность парсить мобильную выдачу, а также значительно увеличена производительность
    • Добавлен парсер позиций в Bing: [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Добавлен парсер [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, позволяющий разгадывать каптчи без использования сторонних сервисов
    • Улучшен сбор почт в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Улучшена работа опции Dynamic threads limit
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! использование прокси для загрузки картинки каптчи теперь определяется параметром Use proxy парсера Яндекса
    • В связи с неактуальностью удалены [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! и [​IMG] Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления в связи с изменениями в выдаче
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлено определение опечатки в запросе
    • В[​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! исправлен проход по страницам
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    Исправления
    • Исправлен Safe search в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлены падения при работе с [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлена ошибка при работе с модулем mysql2 версии более 1.5.3
    • Исправлен парсинг количества результатов в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
     
  12. Для просмотра ссылки войдите или зарегистрируйтесь!
    Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!
    Для просмотра ссылки войдите или зарегистрируйтесь!
    В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.
    [​IMG]

    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь Для просмотра ссылки войдите или зарегистрируйтесь!.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.

    Предыдущие сборники статей
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
     
  13. Для просмотра ссылки войдите или зарегистрируйтесь!
    28-й сборник рецептов. В нем будет показан способ автоматизации парсинга данных из Wordstat, пример парсинга информации о приложениях со скидками в Google Play, а также готовое решение для сбора подсказок из Яндекс вместе с их типами. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Периодически в Google Play разработчики предлагают скидки на приложения, иногда на короткий срок платные становятся полностью бесплатными. С помощью A-Parser можно искать подобные предложения. Кроме этого, в этом парсере собирается множество дополнительных данных и используется сохранение в sqlite базу данных, поэтому его можно рассматривать как еще один пример работы с базами данных в А-Парсере. Готовое решение доступно в каталоге по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    В A-Parser есть стандартный парсер Яндекс подсказок, который по заданным ключевым словам собирает подсказки. Но Яндекс классифицирует подсказки по различным типам, которые в свою очередь позволяют использовать их более рационально, применяя соответствующие фильтры. Стандартный парсер подсказок не возвращает типы, поэтому по ссылке выше опубликован JS парсер для сбора подсказок вместе с их типами.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    В этом парсере реализован автоматический сбор данных из WordStat. При этом, парсер проверяет наличие необходимых для данной задачи аккаунтов, и если требуется - то автоматически регистрирует их. Такое решение может быть полезно для организации периодического парсинга WordStat в автоматическом режиме. Готовое решение - по ссылке выше.
    [​IMG]

    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.
    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь! - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  14. rubikob

    rubikob New Member

    Если ты редко используешь свои крылья, бывает больно их расправлять.
     
  15. rubikob

    rubikob New Member

    Если ты редко используешь свои крылья, бывает больно их расправлять.
     
  16. Для просмотра ссылки войдите или зарегистрируйтесь!
    [​IMG]
    Улучшения
    • Улучшение Просмотра логов:
      • Фильтр по неудачным/выполняющимся задачам
      • Сортировка по времени выполнения
      • Поддержка пагинации и поиска по логам
      • Отображение парсера и запроса
    • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
    • Добавлен новый парсер [​IMG] Для просмотра ссылки войдите или зарегистрируйтесь!, который позволяет проверить сайт в блэклисте Яндекса
    • В [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь! реализована возможность сравнивать данные по ключевым словам
    • Улучшения в логике [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Улучшена стабильность JavaScript парсеров (движка v8)
    • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
    • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
    • JS парсеры: добавлено кэширование DNS ответов

    Исправления в связи с изменениями в выдаче
    • Исправлен парсинг мобильной выдачи в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • Исправлен [​IMG]SE:: DuckDuckGo::Images при работе с некоторыми видами запросов
    • Исправлен парсинг при 1-м результате в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!, [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!

    Исправления
    • Исправлена обработка пустых запросов в JavaScript парсерах
    • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
    • Исправлена работа с некоторыми видами прокси
    • Исправлена работа опции Stop when found в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • В [​IMG]SE::Yandex при получении ошибки от антигейта не менялись прокси
    • Исправлен парсинг ссылок на потенциально опасные сайты в [​IMG]Для просмотра ссылки войдите или зарегистрируйтесь!
    • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
    • JS парсеры: исправлено зависание потоков при использование tls
    • JS парсеры: множественные исправления в работе сокетов
     
  17. Для просмотра ссылки войдите или зарегистрируйтесь!
    29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

    Для просмотра ссылки войдите или зарегистрируйтесь!
    В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.
    [​IMG]

    Для просмотра ссылки войдите или зарегистрируйтесь!
    Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.
    [​IMG]

    Еще больше различных рецептов в нашем Для просмотра ссылки войдите или зарегистрируйтесь!!
    Предлагайте ваши идеи для новых парсеров Для просмотра ссылки войдите или зарегистрируйтесь!, лучшие будут реализованы и опубликованы.

    Подписывайтесь на Для просмотра ссылки войдите или зарегистрируйтесь!- там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Для просмотра ссылки войдите или зарегистрируйтесь!.
     
  18. Для просмотра ссылки войдите или зарегистрируйтесь!
    Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.

    В уроке рассмотрено:
    • Работа с Node.js и Node package manager (npm)
    • Первый запуск npm, установка модулей (пакетов)
    • Использование модулей при создании JS парсера
    • Ресурсы для работы с npm
    Ссылки:
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    • Для просмотра ссылки войдите или зарегистрируйтесь!
    Оставляйте комментарии и Для просмотра ссылки войдите или зарегистрируйтесь!