Есть файл №1 из Яндекс Метрики с адресами страниц (УРЛ) нашего сайта и данными о посещаемости каждой из них (в проекте выложена усеченная версия файла. Исполнитель получит полную версию).
Все страницы сайта разбиты по странам. Название страны присутствует в самом конце УРЛ:
В файле №2 дан список названий стран и их обозначения в адресе страницы.
Для анализа нам нужно сопоставить эти два файла, чтобы в итоге понять, сколько посетителей пришло к нам на сайт на страницы какой-либо страны в целом.
Для этого берем из файла №2 поочередно обозначение страны и ищем его совпадение в адресах страниц файла №1.
Все УРЛ файла №1 подчиняются одной и той же схеме: может быть всего 4 случая:
1. Название страны употреблено без областей, районов и проч., в конце УРЛ есть слэш, название страны заключено в знаки: /название/
Например,
2. Название страны употреблено без областей, районов и проч., в конце УРЛ нет слэша, название страны заключено в знаки: /название
Например,
3. Название страны употреблено с областью, районом и т.д., в конце УРЛ есть слэш, название страны заключено в знаки: _название/
Например,
4. Название страны употреблено с областью, районом и т.д., в конце УРЛ нет слэша, название страны заключено в знаки: _название
Как мне кажется, алгоритм должен быть таким. Первый слеш с конца, если он есть, отбрасывается:
. Далее, значение до знака "/" или "_" сравнивается со списком обозначений стран.
Таким образом, находим все УРЛ с упоминанием названия страны и суммируем данные по всем этим урлам внутри столбцов В, С.
На выходе я хочу получить суммированные данные из столбцов В, С по странам, указанным в файле 2.
Макрос нужно сделать так, чтобы я мог менять список стран в файле №2.
P.S. Обратите внимание, что в списке стран в файле №2 указаны не все страны, которые есть в файле №1. Так что сумма посещений и визитов по странам файла №2 будет меньше, чем сумма по всем странам в файле №1.