Рубрики
Проекты

Парсер avito

Проект парсинга данных с сайта объявления авито. Код проекта на github.com

Используются:

  • Selenium Webdriver
  • BeautifulSoup
  • Tesseract-ocr (модуль pytesseract)

Сохранение пакетов зависимостей в файл requirements.txt

pip freeze > requirements.txt

Tesseract-ocr

На машине должен быть установлен локально Tesseract-ocr

Для ubuntu:

sudo apt-get install tesseract-ocr

Для mac

brew install tesseract --all-languages
Получение телефона объявления

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *