Необходимо сделать разработать программу со следующим функционалом:
Входные настройки:
- Список ASINов (ASIN это внутренний идентификатор товара на амазон)
- Количество слов для разбития на словосочетания
Функционал:
- Для всех АСИНов (товаров) необходимо собрать все отзывы. Ссылка на отзывы:
, пример:
- Каждый отзыв мы разбиваем на предложения. Предложения на словочетания и слова.
К примеру:
We've had it only one day.
Должно получиться:
We've
Had
It
only
one
day
We've had
We've had it
We've had it only
We've had it only one
had it
had it only
had it only one
had it only one day
it only
it only one
it only one day
only one
only one day
one day
Не забываем учитывать количество заданное в настройках. К примеру если стоит 4, то We've had it only one браться не должно, так как содержит 5 слов.
Для каждого отзыва список слов/словосочетаний должен быть уникальным, т.е. в пределах одного отзыва слово или словосочетание учитываем только 1 раз.
- После того как для каждого отзыва соберем список слов и словосочетаний надо их посчитать.
К примеру: отзыв 1 содержит слово good и отзыв 2 содержит слово good и того good будет иметь 2 повторения.
Сохранение:
Данные должны сохранятся в Excel таблицу. 1 вкладка = 1 товар (АСИН), название вкладки = АСИН.
На вкладке суммарные данные по отзывам по словам и словосочетаниям по отзывам для товара.