Исследовательская задача по генерации deepfake видео
Критерием выполнения будет порождение видеоролика, в котором заданный персонаж говорит заданный текст.
На входе:
1) текст в текстовом виде и
2) эталонный видеоролик, в котором видно лицо персонажа,говорящего некоторый эталонный текст.
На выходе:
Порожденный видеоролик (20-60 секунд), в котором персонаж говорит заданный на входе текст.
Качественное измерение результата – движение губ и мимика лица говорящего должны быть естественными, губы не размыты, движение губ соответствовать произносимому тексту.
Считаем, что задача генерации голоса заданного тембра является подзадачей, для которой тоже необходимо найти подходящее решение, считаем, что набор звучания голоса имеется.
Технологии реализации пока рассмотрим любые.
Оплата по договоренности — за время, или за результат, готовы обсудить предложения.