Проект парсинга данных с сайта объявления авито. Код проекта на github.com
Используются:
- Selenium Webdriver
- BeautifulSoup
- Tesseract-ocr (модуль pytesseract)
Сохранение пакетов зависимостей в файл requirements.txt
pip freeze > requirements.txt
Tesseract-ocr
На машине должен быть установлен локально Tesseract-ocr
Для ubuntu:
sudo apt-get install tesseract-ocr
Для mac
brew install tesseract --all-languages