Мы в Telegram

Добавить новость

Календарь

Сентябрь

2021

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Парсинг

0

06.09.2021 19:58

«Фрилансим»

Есть микросервис на python, который должен парсить около 17000 rss ссылок.
Каждая rss ссылка хранит ссылку на сайт. Нужно парсить сайты
Большинство сайтов имеют общую структуру и нужны данные лежат в мета тэгах.
На данный момент нужно улучшить работу парсера.

Задача:
Нужно парсить сайт, который указан в rss ссылке и сохранять следующую информацию
1. Название статьи
2. Авторы
3. Дата публикации
4. Ссылка на картинку
5. Абстракт(короткое описание)

Вся информация берется только из метатэгов.
Основная проблема - иногда метатэг хранит обрезанный абстракт. Нужно брать обрезанный абстракт и искать в остальной странице недостающий кусок текста. Сейчас это уже реализовано, но работает плохо

Для понимания концепции можно скачать приложение для android из playmarket - Allpapers

Бюджет указан приблизительный
В отклике укажите телеграм

ТАСС: пассажиров эвакуируют на станции "Спортивная" после сообщения о задымлении Делегация сельскохозяйственного института Китая посетила Коломну «Я тебе голову отрежу, клянусь Аллахом»: в Москве мигрант-нелегал напал на прохожего Евросоюзу не по зубам санкции против «Росатома» – немецкий экономист

Светские новости от Life24.pro

Губернаторы России

Москва

Собянин посетил фестиваль "Москва – на волне. Рыбная неделя"

Добавить объявление

Ростов-на-Дону

Южный нарколог в Ростове-на-Дону

Ростов-на-Дону

Мебель под заказ в Луганске и ЛНР

Абакан

Кровати металлические, износостойкие и прочные столы, мебель оптом

Москва

Доставка дизельного топлива. ГОСТ

Спонсоры

Москва

НА ДЕТСКОМ ФЕСТИВАЛЕ ИСКУССТВ «НЕБО» СОСТОИТСЯ 5 ПРЕМЬЕР И ПОКАЖУТ НОВИНКИ ОТ ВЕДУЩИХ МОСКОВСКИХ ТЕАТРОВ

Губернаторы России

103news.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.

Все города от А до Я

Москва

Сергей Собянин: фонд музея "Царицыно" собрал 61 тыс. произведений искусства

103news.com — международная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Песня

Литературно-музыкальный вечер «Песня как признание в любви»

Спорт в России и мире

Sport.russia24.pro

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

Больше всего работников с креативными идеями работает в ритейле и спорте

МегаФон привёз спасателям и пожарным грузовик связи

Вышел второй подкаст онлайн-лектория «Иннагрика» о возможностях аграрной генетики для молодых исследователей

Надежда Петрова

Теннисистка Петрова: Хачанов совершил недопустимую ошибку на "Ролан Гаррос"

Glamorous tennis influencer Rachel Stuhlmann braves cold in revealing low-cut top and skirt sending fans wild Талибы заявили о готовности устранить все препятствия в отношениях с Россией Столичная полиция задержала подозреваемого в угоне машины такси, водителем которой оказался нелегал Гастроэнтеролог Белоусов: высокобелковая диета повышает риск онкологии

Новости Крыма на Sevpoisk.ru

Агрегатор новостей 24СМИ

Москва

POMPEYA и O! МАРГО выступят на фестивале «НЕБО»

Частные объявления в Вашем городе, в Вашем регионе и в России

Добавить объявление

Ростов-на-Дону

Южный нарколог в Ростове-на-Дону

Ростов-на-Дону

Мебель под заказ в Луганске и ЛНР

Абакан

Кровати металлические, износостойкие и прочные столы, мебель оптом

Москва

Доставка дизельного топлива. ГОСТ

Мобильная версия 103news.com