Заказчик
Зарегистрирован: меньше месяца
Отзывы + 0 / - 0
Откликнуться

Необходимо создать полную оффлайн-версию раздела сайта: 👉 https://www.guoxuedashi.net/xi angxingzi/

Бюджет: по договоренности
📌 Заголовок

Создание полной оффлайн-версии раздела сайта (Wayback Machine)

---

📝 Описание задачи

Необходимо создать полную оффлайн-версию раздела сайта:
👉 www.guoxuedashi.net/xiang...
(象形文字典 — словарь иероглифов)

⚠️ ВАЖНО:
Живой сайт недоступен и НЕ ДОЛЖЕН использоваться.
Работа выполняется ИСКЛЮЧИТЕЛЬНО через web.archive.org (Wayback Machine).

---

🎯 Цель проекта

Получить локальную версию раздела, которая:

открывается без интернета (обычным кликом по HTML);

корректно отображает весь текст и все изображения
(включая мелкие пиктограммы и крупные иллюстрации);

имеет рабочие внутренние ссылки;

допускает изменение структуры папок (не обязательно 1:1 с URL);

результат — папка или архив + HTML, без серверной части.

Поиск на сервере не требуется.

---

📂 Объём работ

Нужно восстановить ВЕСЬ раздел /xiangxingzi/, включая:

индексные / списочные страницы;

страницы отдельных иероглифов;

перекрёстные внутренние ссылки.

---

🔴 ВАЖНО: работа с Wayback (критический пункт)

На данный момент в Wayback Machine:

часть страниц иероглифов открывается корректно;

часть страниц не открывается по прямой ссылке, но может быть доступна:

в других timestamp (дате архивирования);

через поиск сохранённых URL;

через альтернативные архивные пути.

❗ Требования к исполнителю

Исполнитель ОБЯЗАН:

1. НЕ ограничиваться одним snapshot Wayback.

2. Проверять несколько timestamp для недоступных страниц.

3. Использовать Wayback CDX API или эквивалентный механизм для поиска сохранённых URL.

4. Восстановить максимально возможное количество страниц иероглифов, даже если:

прямая ссылка /xiangxingzi/XXXX/ не открывается;

требуется поиск альтернативного архивного URL.

5. Для страниц, которые реально отсутствуют во всех версиях Wayback, предоставить отдельный список недоступных иероглифов.

⚠️ Вариант «страница не открылась — просто пропустили» НЕ ПРИНИМАЕТСЯ.

---

🛠️ Технические требования (обязательно)

✔ Работа ТОЛЬКО через Wayback Machine
✔ Python / requests / BeautifulSoup / Scrapy или аналог
✔ Допускается использование Wayback CDX API
✔ Однопоточный или очень медленный режим

❌ ЗАПРЕЩЕНО:

Selenium

wget

HTTrack

VPN / TOR

доступ к live-домену

---

📦 Результат (что считается выполненной задачей)

1. Полностью рабочая оффлайн-версия сайта (HTML + assets)

2. Все изображения отображаются без интернета

3. Внутренние ссылки переписаны на локальные пути

4. Кодировка UTF-8 сохранена (китайские иероглифы)

5. Передача:

папки или архива с сайтом

используемых скриптов (Python)

краткого README

списка страниц, отсутствующих во всех версиях Wayback (если есть)

---

💰 Бюджет и формат оплаты

💵 Фиксированный бюджет за ВЕСЬ проект: 7 000 ₽

Оплата производится поэтапно (milestones),
но общая сумма не превышает 7 000 ₽.

Разделение на этапы используется для безопасности,
но это один проект и один бюджет.

---

👤 Кого ищем

Исполнителя, который:

работал с Wayback Machine;

понимает разницу между live-сайтом и архивом;

умеет работать с кодировками (UTF-8, китайский текст);

не предлагает «просто скачать сайт».

---

❗️Важно

Отклики, в которых:

не упомянут Wayback / CDX API;

предлагается Selenium / HTTrack / wget;

нет описания технического подхода —

👉 рассматриваться не будут.

---

✅ Итог

Бюджет зафиксирован

Риски учтены

«Пропущенные иероглифы» заранее регламентированы

Исполнитель не сможет потом сослаться на Wayback как оправдание
Опубликован 07.02.2026 в 15:17

Выберите способ верификации:

Обновите страницу после прохождения верификации.