IT

Scrapy: создаём краулер/парсер на Python с нуля

Краулинг - процедура анализа веб-страниц, сбор информации и последующий вывод в структурированной форме.
Рано или поздно, решая коммерческие задачи, вы столкнётесь с необходимостью скраулить нужную информацию со сторонних источников, это может быть простое считывание котировок или полноценная конкурентная слежка.

Сейчас набирает популярность Scrapy Framework, который написан на языке Python. Этот простой фреймворк предоставит вам мощный инструмент, с которым вы быстро сможете краулить множество ресурсов. Прочитать документацию можно здесь.

На этом мастер-классе мы развернём виртуальное окружение с нуля, установим нужные библиотеки, настроим инструменты и создадим своего собственного паука для краулинга веб-ресурса.

Содержание вебинара: