Решить задачу скрепинга контента на сложных сайтах, где детектят ботов

Откликнуться
n
Заказчик
Отзывы фрилансеров: + 7 - 0
Зарегистрирован на сайте 4 года и 7 месяцев
Бюджет: Ожидает предложений
Мы решаем задачу скрепинга контента на сложных сайтах, где детектят ботов.

Код должен быть кроссплатформенным Windows/Linux или работать только на Linux

Стек
Язык – Typescript
Тулинг – Eslint (airbnb config), Gulp
www.fl.ru/away/?href=http... — для взаимодействия с браузером
www.fl.ru/away/?href=http... — для запуска браузера

Первая задача, это небольшой прототип:
Запустить в не headless режиме браузер с папкой профилем. Создать профиль, если его нет. Например, node scrape.js ./profile1 – профиль в папке ./profile1
Для этого воспользоваться chrome-launcher, или, если не получится, сделать свой форк и там поменять поведение.
Зайти на google.com 
Поискать что-то
Выдать в консоль title, url всех результатов поиска

Проект большой.
Задачи с которыми предстоит столкнуться в дальнейшем:
Смена user agent и платформы (включая navigator.* и тп фингерпринт) 
Headless режим и обход детекции headless режима
Эмуляция поведения пользователя на странице
И тд
Разделы:
Заказ
Опубликован:
23.08.2021 | 06:25 [поднят: 23.08.2021 | 06:25] [последние изменения: 22.08.2021 | 21:57]
Откликнуться Посмотреть другие заказы Разместить заказ

Теги: нужен программист, резюме программиста, требуется программист, резюме веб программиста

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».