Нейронная сеть для клонирования голоса
Есть dataset для клонирования голосаhttps://www.tensorflow.org/datasets/catalog/vctk
Сформирована предварительная модель.
Необходимо построить модель ConvLSTM2D со слоями MaxPooling2D, Flatten, Dropout, Dense TensorFlow, обучить на TPU в Google Colab https://colab.research.google.com/.
О запуске на TPU https://colab.research.google.com/notebooks/tpu.ip...
Сохранить скомпилированную модель в формате ".h5". Протестировать на тестовом предоставленном аудио и тексте для его озвучки. Предварительно заключаем сделку. Читать дальше...