На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

GeekBrains

4 подписчика

Парсинг блога GB с помощью Python и Scrapy

На вебинаре вы узнаете:

  • Как собирать данные сайтов с минимальными затратами сил и при минимальных знаниях Python и HTML.
  • Как изучать HTML-код сайтов-доноров и планировать работу.
  • Как пользоваться библиотекой SCRAPY.
  • Чем полезны Pipelines и командная строка scrapy shellItems.

В ходе занятия мы создадим базу данных с помощью SqlAlchemy и сохраним полученные данные в нее.

Исходник проекта: https://github.com/GefMar/GBBlogParser

Пройти обучение
Ссылка на первоисточник
наверх