Необходимо обучить модель ML. На входе подаётся текстовый файл с текстом тематической статьи. На выходе получаем набор фрагментов текста, которым присвоены теги. Каждый фрагмент должен содержать минимум два тега - "цветной тег" и "синий тег" (см. прилагаемый файл). Формат файла с выходными данными согласовывается отдельно. Размер исходного файла не имеет ограничений. Исходные фрагменты (абзацы) могут состоять из более 1000 слов
. фрагменты соответствующие тегам должны быть не более 200-500 слов (зависит от разметки). Рекомендуемый max_batch_items не менее 2048. Датасет будет передан после выбора исполнителя. Архитектура модели ML, состав используемых библиотек, фреймворков согласовывается отдельно. Цена договорная.