После парсинга была сделана соответствующая фильтрация, как видно из скриншота. Также есть идея масштабирования (распараллеливания на несколько серверов, но пока не дошли руки)