Сайта “Инвитро.ру”, вкладка “Анализы и цены” (
www.invitro.ru/analizes/f... Анализы и цены invitro.ru
www.invitro.ru Независимая лаборатория ИНВИТРО. Лабораторная диагностика в Москве и регионах. Анализы ...
Задание – написать парсер этого раздела.
В разделе 4 уровня вкладок
1 Уровень – Тип исследований – Гематологические исследования, Биохимические исследования и т.д.
2 Уровень – Подтип исследования, например, для типа Гематологические исследования подтипами будут “Клинический анализ крови, Имуногематологические исследование, Коагулологическое исследование”
У некоторых типов подтип отсутствует
3 Уровень – Вид исследования – номер и стоимость сохранять не требуется.
В некоторых ветках уровня 3 таблица содержат подзаголовки. Их можно пропустить.
4 Уровень – Описание исследование. Здесь необходимо получить содержание четырех вкладок – Описание, Подготовка, Показания, Интерпретация результатов (в некоторых ветках имеются только две вкладки)
Результаты необходимо сохранить в базу так, чтобы для каждого исследования можно было установить его тип и подтип.
Процесс сбора информации на каждом уровне должен быть распараллелен!
Система должен иметь HTTP интерфейс для получение данных из базы.
Код должен быть расположен в гит репозитории.
Используйте PostgreSQL для хранения данных и желательно реализовать без ORM
Система должна работать в докер контейнерах и запуск должен быть автоматизирован.
Тесты на производительность
Изучите ТЗ и назовите сроки которые вам необходимы для его реализации