парсинг с сайтов
Загрузка на должна работать на сервере под debian, лучше всего запуск по cron.
БД - My SQL
1) Загрузка с сайта Pond5.com - разделы Music и SFX
первоначальная загрузка - все что есть сейчас, далее обновление ежедневно.
Обновление нужно делать несколько раз внутри дня - отслеживать новые треки. Раз в день нужно обновлять все целиком. Нужно обновлять кол-во продаж раз в день в проверять изменился ли mp3 (по длине и дате)
Должна быть предусмотрена настройка частоты обновления.
Структура БД - разработать самому, требуется вся информация какая есть о треке ( авторы, ключевые слова, итд).
Хранить ссылки на авторов, ссылку на трек на Pond5.com.
Кроме того, нужно по кажому треку рассчитывать и хранить отпечаток (fingerprint) - выполняется запуском одной команды (опишем подробнее).
Для понимания - в дальнейшем трек будет показываться в таком примерно виде - см. вложенный рисунок
2) то же самое затем нужно будет сделать для источника iStock.com – раздел audio.

Специализируюсь на парсерах. Skype: henneberg_dev
E-mail:
Jabber/Google Talk:
ICQ: 214325364
Тел.: +7-906-955-10-65
Зарегистрируйтесь или войдите на сайт под своим именем.