Есть 30-50 файлов csv со столбцами заполненными различными данными. Нужно проанализировать нужный столбец (везде одинаковый) и вывести повторяющиеся значения из них например, если в файле 1,3,5 в этом столбце есть одинаковые данные. Для excel это будет скрипт объединения csv в xls и операция поиска и вывода дубликатов (как удалить знаю, как только их сохранить не знаю). Пишите, пожалуйста, ориентировочную цену и метод реализации (и варианты). Наверное, это может быть от простого к сложному макрос excel или обработка исполняемым файлом или вообще на php с загрузкой и выводом.
2.Есть более сложный вариант обработки, по маскам нужен ли он зависит от стоимости.
Значения в столбце могут выглядеть в одном отчете как "
" тут все просто.
Но есть вариант что будет выглядеть как
в одном файле,
в другом, но с сохранением домена. В этом случае обработка должна проанализировать все по маске http://*/ (и https://*/) отбросив то что на конце (то есть проанализировать только названия сайтов) и вывести все строки полностью с повторяющимися данными в этом столбце. *Причем может быть несколько в одном файле ссылок с одного домена их нужно вывести не все, а первые три*
*Вот тут надо сообразить возможно как-то упрощу этот момент.
Суть зачем это надо это анализ обратных ссылок на 30 конкурентов с поиском тех сайтов которые ссылаются на 2 и более конкурентов (поиск тематических доноров). Это может быть php скрипт с простейшим интерфейсом с указанием папки где лежат файлы и вывода на странице с возможностью сортировки и сохранения в csv
ИЛИ макрос для Excel с объединением всех csv в один xls и сортировкой внутри по принципу вывести сначала все дубликаты (по сортировке где их больше) по маске домена.
Пожалуйста, не пишите "Готов взяться, большой опыт, пишите" напишите приблизительную стоимость и сроки. Сразу вам плюс в карму за это в любом случае.
Файлы приложены простой(1) и более сложный 1backlink(2) варианты.
Вопросы в треде приветствуются.