Создам квантовый benchmark‑датасет для Quantum ML (Parquet/CSV)
Разрабатываю синтетические benchmark-датасеты для задач машинного обучения и исследований.
Услуга включает не только генерацию данных, но и подготовку полноценного dataset-пакета, который можно сразу использовать в ML-пайплайнах, тестировании моделей и сравнительных экспериментах.
Что входит в услугу
Генерация датасета с заданными параметрами
Поддержка различных сценариев:
clean (без шума)
noisy (с шумом)
multi-target
OOD (out-of-distribution)
Несколько типов квантовых схем
Расчёт признаков и метрик сложности
Разбиение на train / val / test
Формат результата
Parquet (основной формат для ML)
CSV (при необходимости)
Шардирование (для больших датасетов)
Дополнительно предоставляется
schema.json — структура данных
meta.json — параметры генерации
coverage.json — анализ покрытия
report.json — сводная статистика
data_card.md — описание датасета
manifest.json — список файлов
Поддерживаемые параметры
количество кубитов и глубина схем
типы квантовых схем
тип запутанности
наличие и тип шума
observables (Z, X, Y)
режим разметки (global / per_qubit / mixed)
размер датасета
воспроизводимость (seed)
Для каких задач подходит:
регрессия (prediction of expectation values)
классификация (тип схемы)
анализ устойчивости к шуму
OOD тестирование
исследовательские benchmark-задачи
Заказчик получит:
Готовый ML-датасет (100к строк): parquet (shards), CSV, meta/schema/report. Сразу готов к использованию.
До начала работы заказчик должен предоставить:
требуемый размер датасета
параметры схем (количество кубитов, глубина)
тип задачи (регрессия / классификация)
требуется ли моделирование шума
нужны ли train / val / test splits
формат результата