Парсинг zakupki.gov.ru
Собирать нужно всю текстовую часть описания заказов(1) + заголовок заказа(2) (без вложений word, только текст) и данные об организации-заказчике(3)
Данные о тендере следует поместить в отдельный раздел (например НОВОСТИ ***** весь текст тендера публикуем сразу и полностью, включая наименование(2), и в нижней части твиты, лайки и комментарии зарегистрированных пользователей.
как на сайте *****
Заголовки заказов нужно отдельно публиковать в левой части страницы и они же будут являться ссылками на тендеры (этих заголовков показывать не более 30 шт)
Поиск по тендерам будет осуществляться по ключевым словам, городу и дате публикации:
Например "белый кролик" , глубина 20 дней - будут искаться только тендеры, в которых есть эти 2 слова в заголовке или в тексте и которые публиковались не позднее чем 20 дней назад
В тендере нужно будет указать ссылку на ЗАКАЗЧИКА, данные которого нужно будет также собрать.
Сбор и сохранение данных о заказчике
Данные о компании(3) будут парсится и сохраняться напрямую в существующую таблицу фирм, при этом уникальность будет определяться по Email
Если Email отсутствует - нужно будет проверить по адресу и наименованию компании
Все другие данные, кроме адреса сайта, email, города и улицы с индексом записывать в графу "о себе", перенос строки обозначать как <br>
И третья часть - все что парсим - сразу рассылаем по подписчикам (для этого у каждого в настройках будет список поисковых фраз)
И при парсинге каждый подписавшийся будет получать заголовки и первые пару предложений тендеров, которые отвечают поисковому запросу (содержат в своем тексте заданные слова)
В письме будет ссылка на сам тендер.
Зарегистрируйтесь или войдите на сайт под своим именем.