--> -->

Бесплатно зарегистрируйся и получай уведомления о новых проектах по работе

Поделиться:

Парсинг двух сайтов (каталогов)

g
Заказчик
Отзывы фрилансеров: + 21 0 - 0
Зарегистрирован на сайте 7 лет и 7 месяцев
Безопасная сделка Бюджет: 5000 ₽
68.27 $ — 58.17 €
Требуется спарсить данные из двух сайтов и сопоставить их между собой. 

WEBOMETRICS
webometrics.info/ 
Пример страницы со списком вузов в США: webometrics.info/en/North... 

Требуется сделать таблицу со всеми университетами с этого сайта. 
Столбцы таблицы, созданные на базе webometrics: 
1. Название университета на английском языке
2. Название университета на местном языке (пишется через / в той же строке, что и название на сайте)
3. Страна университета
4. Регион университета
5. URL страницы вуза на сайте webometrics
6. Официальный URL вуза
7. World Ranking
8. Continental Ranking
9. Country Rank
10. Presence Impact
11. Openness
12. Excellence

DBPEDIA
dbpedia.org/page/Harvard_...
Пример страницы одного вуза:

Требуется найти все университеты, которые будут собраны с webometrics в базе данных DBPedia и объединить их воедино.
Столбцы таблицы, созданной на базе dbpedia:
1. название университета на английском языке (могут быть небольшие отличия в названиях одних и тех же вузов на двух сайтах)
2. название университета на местном языке
3. URL университета на сайте dbpedia
4. Все поля, которые есть на странице вуза (abstact, accrediation, country etc – пример разных полей есть тут dbpedia.org/page/Harvard_... Особенность в том, что названия и количество полей в разных вузах разное. 

Итоговый файл можно сделать в CSV или другом формате. 

Готов подробнее описать задачу.
Разделы:
Опубликован:
05.06.2020 | 20:09 [последние изменения: 05.06.2020 | 20:09]

Теги: Специалисты по парсингу, недорого, FL.ru