Нужно спарсить диалоги с сайта с фанфиками, пример странички —
archiveofourown.org/works... Первый параметр парсинга — берем то, что в кавычках внутри каждой новой строки, — сообщение, парсим из той же строки имя (то что с большой буквы, первое, нужна база имен локальная, публичную нагуглим какую-то?). Вторые кавычки внутри той же строки — как дополнительный диалог от того же персонажа.
Второй параметр парсинга — по примеру этой страницы —
archiveofourown.org/works... Берем то, что после двоеточия на новой строке, — сообщение. То, что до двоеточия — имя.
И нужен комбинированный режим из обоих параметров, в том числе для варианта из второй ссылки.
Как результат ожидаю получить скрипт (Питон, надеюсь!), который принимает кучу ссылок, параметры парсинга и выдает один CSV файл со столбиками — фанфик ид, собеседник, сообщение, ссылка на страницу