парсинг с сайтов

Все проекты
Прошло времени:   11 лет 6 месяцев 6 дней 22 часов 53 минут
Требуется парсинг информации с двух сайтов - музыкальных стоков.
Загрузка на должна работать на сервере под debian, лучше всего запуск по cron.
БД - My SQL

1) Загрузка с сайта Pond5.com - разделы Music и SFX
первоначальная загрузка - все что есть сейчас, далее обновление ежедневно.

Обновление нужно делать несколько раз внутри дня - отслеживать новые треки. Раз в день нужно обновлять все целиком. Нужно обновлять кол-во продаж раз в день в проверять изменился ли mp3 (по длине и дате)

Должна быть предусмотрена настройка частоты обновления.

Структура БД - разработать самому, требуется вся информация какая есть о треке ( авторы, ключевые слова, итд).
Хранить ссылки на авторов, ссылку на трек на Pond5.com.
Кроме того, нужно по кажому треку рассчитывать и хранить отпечаток (fingerprint) - выполняется запуском одной команды (опишем подробнее).

Для понимания - в дальнейшем трек будет показываться в таком примерно виде - см. вложенный рисунок

2) то же самое затем нужно будет сделать для источника iStock.com – раздел audio.
    Предложения фрилансеров
    Бюджет: 1 руб.
    Сроки: 20 часов
    Twiggy_Dasha [30.11.2013 10:39]  
    Давайте, обсудим задачу. Есть несколько важных вопросов.
    Специализируюсь на парсерах. Skype: henneberg_dev
    E-mail:
    Jabber/Google Talk:
    ICQ: 214325364
    Тел.: +7-906-955-10-65
    Видеть контакты заказчика и оставлять свои предложения по проекту могут только зарегистрированные и авторизованные пользователи.
    Зарегистрируйтесь или войдите на сайт под своим именем.

    Фриланс-биржа Web-lance.net предлагает огромные возможности по поиску работы как опытным специалистам в сфере интернет-бизнеса, так и новичкам, только постигающим основы заработка во всемирной сети. Здесь вы найдете сотни интересных вакансий в сфере дизайна, копирайтинга, программирования, верстки, контент-менеджмента и других сфер деятельности востребованных среди интернет-пользователей. Также, зарегистрировавшись на бирже, вы сможете разместить здесь свою анкету, указав в ней свою специализацию и контактные данные, что даст возможность потенциальным клиентам, связаться с вами для дальнейшего взаимовыгодного сотрудничества. Сайт удобно структурирован и разбит на тематические разделы, что позволяет даже неопытным заказчикам точно определять категорию, в которую стоит публиковать их проект, в тоже время, упрощая исполнителям поиск интересующих их вакансий. Кроме того на портале имеется раздел Блоги где зарегистрированные пользователи могут публиковать материалы, а также Форум на котором исполнители и заказчики смогут обсудить рабочие моменты, а также пообщаться на интересующие их темы. Приятной вам работы на Web-lance.net - бирже, где вы сможете найти лучших исполнителей и самые интересные проекты.

    Для фриланса нет ограничений по возрасту. Так, 14-летняя Эшли Кволс, художница из США, уже заработала первый миллиард. Среди начинающих и продвинутых можно встретить и людей в возрасте от 50-60 лет.