Увеличить кол-во входных токенов в работающей Open source TTS модели
Необходима доработка - возможность передавать за 1 раз не менее 300 символов (2048 токенов)
Ожидаемый результат: ветка в моем форке, которая соберется и отработает в колабе.
PS По факту подойдут любая TTS модель с открытой лицензией и качеством генерации не ниже указанной (человеко-подобная речь с эмоциями)