Требуется разработать некий сервер агрегации контента, который:
1. Будет обходить несколько сайтов торрент-трекеров, и собирать информацию о них во внутреннюю базу.
2. Будет обходить один или несколько сайтов с мета-информацией о контенте (IMDB, Kinopoisk, AllMusic и т.д.) и сохранять инфу о мета-информации о себя во внутренней БД.
3. Будет делать сопоставление данных по пунктам 1 и 2. Т.е. каждой записи о медиа-контенте будет сопоставляться один или несколько торрентов.
4. Поиск. Пользователь вводит название альбома, на выходе получает мета-информацию из пункта 2, и соответствующий этой единице контента список ссылок из пункта 1.
Объем БД по п.1. порядка 200 000 300 000 записей; по п.2 100 000 записей.
Платформа реализации обсуждается. Предпочтительно Python. ОС Debian.
Доступ к сайтам источникам: как через API, так и через граббинг HTML.
Предпочтительная модель работы Fixed price.
Более детальное ТЗ по запросу.
В личку жду предложений о заинтересованности и хотя бы порядок бюджета.
Опубликован 02.01.2013 в 20:33