Машинное обучение: кластеризация текстов python

16.12.2023 20:09

На входе есть коллекция текстов - описания стартапов. На выходе технологические тренды на базе этой коллекции текстов. Например: "AI в маркетинге для оптимизации рекламы".

Как вижу пайплайн:

1. Взять тексты и применить модель кластеризации. Выделить N кластеров. Для каждого кластера записать его мощность - число точек внутри него.

2. Кластер будет соотстветствовать тренду. Необходимо дать "название" тренду. Для этого предлагается извлечь три описания стартапов, которые максимального близки к центроиду. Далее аналитик на них смотрит и дает название тренду.

3. На выходе таблица: номер кластера, мощность кластера, три описания стартапов внутри кластера.

Скрипт должен быть написан на Python и выложен в Google Colab с комментариями. Следующей итерацией (если с этим заданием ок) предполагается обобщение описаний стартапов внутри кластера до трендов при помощи GPT. В этом проекте требуется компетенция в машинном обучении и NLP.

29ru.net

Синоптики спрогнозировали в Москве до 20 градусов тепла и небольшой дождь 16 мая В Мытищах наградили лучших игроков, тренеров и специалистов хоккейной школы Айсен Николаев подписал кадровые указы В Туле суд выпустил на свободу кавказца, который вместе с братом избил девушку

Светские новости от Life24.pro

Губернаторы России

Москва
Сергей Собянин: в ТиНАО создадут новые управы районов

Добавить объявление

Москва
Детский лагерь Образование Плюс I при школе

Москва
Помощь юриста по подключению электричества в Москве

Москва
Услуги юридического сопровождения сделок в Москве

Москва
Помощь юриста в процедуре банкротства физического лица в Москве

Машинное обучение: кластеризация текстов python

«Сделать кожу чистой, свежей и молодой»: что такое энзимная пудра и для чего она нужна

В Туле суд выпустил на свободу кавказца, который вместе с братом избил девушку

Синоптики спрогнозировали в Москве до 20 градусов тепла и небольшой дождь 16 мая

Новосибирскую школьницу, изрезавшую одноклассницу, отправили на экспертизу в Москву

Сергей Собянин: в ТиНАО создадут новые управы районов

В мире могут закрыть поставки из Китая. «Святой Ленин» на встрече В.В. Путина и Си Цзиньпина повышает качество жизни народам России, Китая, всего мира.

Неделя мэра: завод «Москвич», гранты для школ искусств и система городских вокзалов

Продюсер Пригожин поддержал певицу Королеву после отмены ее номера в телеэфире

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

В Подмосковье сотрудники ОМОН «Русич» Росгвардии приняли участие в церемонии открытия соревнований по дзюдо среди детей и подростков

Инсайты, стратегии и нетворкинг для профессионалов: 21 июня пройдет ежегодный форум «Спорт и Бизнес»

В ЦСКА рассказали о тяжести травмы голкипера Владислава Торопа

Соболенко вышла в полуфинал турнира WTA в Риме

Новости Крыма на Sevpoisk.ru

Страдания юного Аюша Булчун

Частные объявления в Вашем городе, в Вашем регионе и в России