Добавить новость
103news.com
Работа
Май
2024

Topic Modeling на Python

0

Topic Modeling на Python, сделать до завтрашнего утра.

Анализ текстовых данных с использованием тематического моделирования (topic modeling) и использование результатов для объединения сообщений в группы.

Тематическое моделирование различными методами.

Варианты типа данных для исследования:

- Научные статьи;

- Относительно большие сообщения в СМИ (размером от 4-х предложений и до 1 листа А4).

Распределить сообщения по репрезентативным группам с использованием topic modeling

Если более человеческим языком, то нужно:

1. Пропарсить в интернете научные статьи или сообщения в СМИ

2. Применить к полученным данным алгоритмы тематического моделирования (2 будет достаточно)

3. Объединить данные по группам исходя из пункта 2

4. Парсинг, тематическое моделирование и объединение данных по группам должно быть в рамках одного запуска программы. То есть запускаем программу и на выходе получаем сообщения, разделенные на репрезентативные группы. В идеале, если возможно, указание для каждой группы темы(или тега), по которой они разделены.

5. Для парсинга лучше всего использовать комментарии к постам каких-нибудь официальных СМИ, например Lenta.ru, Gazeta.ru или Russian.rt.com.





Губернаторы России
Москва

Москва-Пекин. Собянин в Китае подписал соглашение о сотрудничестве





Москва

Топ-5 самых ярких зарубежных архитектурных проектов на первичном рынке Москвы


Губернаторы России

103news.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.

Moscow.media
Москва

Москва-Пекин. Собянин в Китае подписал соглашение о сотрудничестве



103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Найк Борзов

Братья Грим и Найк Борзов зажгут в Нижегородской области на Дне молодежи




Спорт в России и мире

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

В Лужниках состоялась церемония открытия Всероссийской Спартакиады Специальной Олимпиады

Красногорск первым встретил участников международного супермарафона Москва-Минск

Военно-спортивный фестиваль Росгвардии в «Лужниках» собрал более 20 000 москвичей и гостей столицы


Большой шлем

«Надо чем-то жертвовать». Арина Соболенко отказалась ехать на Олимпиаду в Париже



Новости Крыма на Sevpoisk.ru


Москва

В России запустили бесплатного цифрового ЗОЖ-помощника



Частные объявления в Вашем городе, в Вашем регионе и в России