Заказчик
Отзывы фрилансеров:
+ 0
- 0
Зарегистрирован на сайте 4 месяца
Бюджет:
20 000 руб
254.69 $ — 217.84 €
О проекте
Мы разрабатываем сервис для автоматического улучшения тексты расшифровки аудио и видео через LLM. То есть, после того, как Speech-to-text модель выдает текст расшифровки, данный текст должен также проходить через LLM для улучшения факторов, как грамматика, форматирование и т.д.
Задача
Основная проблема, с которой мы сталкиваемся модель теряет контекст и снижает качество обработки на аудиофайлах (3-4 тысячи слов). Ваша задача помочь нам решить эту проблему путем оптимизации существующих промтов, настройки параметров модели (Уточним, что модель это API решение от провайдеров OpenAI, GroqCloud или Cerebras, то есть не self-hosted).
Мы предоставим вам наши текущие промты на английском языке, для русских и английских текстов, которые детально описывают требования к обработке текста.
Что нужно будет сделать:
1. Проанализировать текущие промты: Изучить наши инструкции для AI-модели и выявить слабые места.
2. Оптимизировать промты: Предложить и внести правки в промты для повышения стабильности и качества транскрибации, особенно на длинных текстах.
Ключевые требования к результату обработки текста
Главный принцип, которым мы руководствуемся: точность и верность оригиналу превыше всего. Модель не должна быть "креативной", модель должна улучшать грамматику, орфографию, текста. Она не выступает профессиональным редактором
Что должна делать модель:
• Улучшать читаемость: Расставлять знаки препинания (точки, запятые, вопросительные знаки), исправлять пунктуационные ошибки и делить слитный текст на предложения.
• Исправлять грамматику и орфографию: Корректировать очевидные ошибки и опечатки (например, "ихний" -> "их", "в течении" -> "в течение").
• Форматировать текст: Приводить в порядок капитализацию (большие буквы в начале предложений, в именах собственных), убирать лишние пробелы.
• Обрабатывать слова-паразиты: Аккуратно удалять явные слова-паразиты ("ну", "э-э", "как бы"), только если они не несут смысловой нагрузки.
Чего модель НЕ должна делать (критически важно):
• Не изменять слова: Не заменять, не добавлять и не удалять слова, если это меняет смысл сказанного.
• Не перефразировать: Не переписывать предложения, сохранять оригинальную структуру и стиль речи говорящего.
• Не добавлять ничего от себя: В итоговом тексте должен быть только отполированный транскрипт без каких-либо комментариев или пояснений.
Кого мы ищем
• Специалиста с опытом в промт-инжиниринге и пониманием принципов работы больших языковых моделей (LLM).
• Специалиста, который понимает, как параметры модели влияют на конечный результат.
• Опыт работы с задачами обработки текста (NLP) и/или транскрибации будет большим плюсом.
Разделы:
Заказ
Опубликован:
08.11.2025 | 22:57 [поднят: 08.11.2025 | 22:57]
Заказ находится в архиве