скачано 26,4 млн уникальных документов по результатам парсинга поиска Яндекса. Для получения ссылок на файлы обработано 11,8 млн поисковых запросов. Для контроля уникальности файлов использовались SHA1 хеши скачанных документов.