Необходимо протестировать разные виды софтов, AI моделей, которые позволяет делать deepfake голосом конкретного человека. Обязательно хорошее знание английского языка и достаточно глубокие знания IT (опыт в настройке и пользовании различного софта).
Так же вам понадобиться мощный компьютер(реально мощный), минимум 300 гигабайт пространства на компьютере.
Задача к примеру нам нужно воссоздать голос какой-нибудь звезды (конкретно выберем позже). Языковые модели работают по принципе того, что им нужно скормить условно 30-50 часов аудио с разговором конкретного человека, чтобы языковая модель качественно рассказывала заданный текст именно тем голосом и интонацией, которой необходимо. Еще лучше если модель позволяет нам с одной стороны взять готовую модель, в которую мы загрузили много аудио и она может проговаривать текст именно нужным голосом. А с другой стороны у нас есть аудио дорожка, которая должна быть озвучена именно такой интонацией, которая нам необходимо. Чтобы можно было наложить первое на второе и получить нужный нам результат.
Работа займет около 2-4 дней, т.к. сначала нужно будет скачать и протестировать различные модели, такие как
www.tensorflow.org/ Так же нужно изучить, по каким принципам работает
veravoice.ai Это одна из не очень крутых реализаций, но логика, от которой они плясали, верная. У них есть голоса звезд, но очень все урезанно и можно записывать только поздравления с определенным текстом.
Сама логика подхода в исследовании должна быть такой: скачали приложение, потестировали, зашли на сайт, посмотрели все, зашли на ютуб канал их изучили комментарии на предмет подробностей, как они это делали (а они просто использовали АПИ публичного или приватного AI сервиса), далее почитали в интернете разборы на habr по тематике, посмотреть иные youtube ролики по теме (там тоже видел примеры, как люди свой голос копировали, загрузив в AI всего 1.5 часа своей речи).
Для теста логично взять часовой монолог какого-нибудь человека с достаточно выразительным голосом. Попробовать его скормить разным языковым моделям и сделать по каждой сравнительное аудио. Выбрать максимальное количество AI сервисов.
Еще материалы по теме, от которых можно танцевать
vc.ru/flood/23846-lyrebir... proglib.io/p/golosovoy-de... nplus1.ru/news/2021/10/12... Хорошо, если у вас уже имеется опыт в тематике, и вы сможете опираясь на что-то быстрее решить задачу.
Если вы реально способны помочь в решении задачи, то оплату сможем обсудить