Добавить новость
Главные новости Санкт-Петербурга
Санкт-Петербург
Сентябрь
2019

Парсинг магазина (сбор данных, хранение, обработка, отслеживание)

0
Всем доброго времени суток!

Для единоразового долгосрочного проекта требуется весьма опытный разработчик (Middle/Senior). Проект связан с промышленным парсингом магазина и регулярным отслеживанием данных в нем (изменения в цене на товар и прочая динамика) с выводом их во фронтенд. Вам предстоит написание парсера (сначала более простого, но
будем совершенствовать) для большого количества данных, сохранение их,
операции с данными (фильтрации, сортировки и т.п.), отслеживание
изменений и динамики. Оплату обсудим после оценки нашего ТЗ. Вам
предстоит плотно засесть за проект, поэтому желательно уделять ему не
менее 20 часов в неделю. Готовы рассматривать как full-time так и
part-time.

Наши требования:

- ЯП предпочтительно Python. Если владеете другим и считаете что он больше
подойдет для решения задачи, то готовы послушать мнение. Фрейморк Django
последних версий.
- Очевидно, опыт в парсинге;
- Опыт работы с большими объемами данных;
- Базы данных, предпочтительно Postgres;
- Опыт или понимание при разработке масштабируемых систем.

Будет плюсом:

- Большим преимуществом будет опыт подобного промышленного парсинга;
- Опыт визуализации данных на картах (как на Avito недвижимость, Airbnb и подобных сервисах);
- Опыт в DevOps, деплое.


Если вы хотите попробовать себя,
Пишите по контактам
Или в отклики на этой странице.

Сразу напишите ваш опыт в разработке, в парсинге, работе с большим объемом
данных, понятен ли вам пример ниже (ваши вопросы, если не понятен), как
бы вы всё обустроили.

Чтобы понимать масштаб, оставлю пример одной из задач, которую, вероятно будете выполнять первой.

Пример одной из задач парсера:

Необходимо спарсить все отзывы пользователей, их около миллиона.

Один отзыв пользователя содержит следующую информацию: `никнейм юзера, дата
публикации отзыва, приобретенный товар, (название товара это ссылка на
него), место, город, в котором он приобрел этот товар, рейтинг отзыва
(оценка товара) и его содержимое (текст отзыва).`

На основе спарсенных отзывов, собрать следующие данные с возможностью фильтрации/сортировки:

- Все отзывы конкретного пользователя, с фильтрацией по приобретенному
товару, городу, рейтингу. Если пользователь `user1` оставил 10 отзывов
над разными товарами с разными городами, нам нужно всё собрать с
возможностью фильтрации;

- Информация о каждом приобретенном товаре/категории товара (сколько раз приобрели этот товар) с фильтрацией по городу. Например, товар из категории Яблоки был куплен 30 000 раз в 15 разных городах. Нужно собрать всё вместе с возможностью фильтрации -
выбрали категорию Яблоки и смотрим, сколько раз он был приобретен за
определенный промежуток времени. в определенном городе;

- Информация о каждом городе, в котором приобретались какие-то товары.
Например, в городе Москва за определенный промежуток времени было
куплено 50 000 товаов категории Яблоки;

- Отслеживание новых отзывов и помещение их в базу, для создания статистики по каждому товару, (сегодня товар Яблоки купили 100 раз, в городе Санкт-Петербург),
составление определенной статистики (какая доля товаров из категории
Яблоки была приобретена сегодня в городе Москва);

- Возможно, визуализация некоторых из данных выше на карте (как у Авито надвижимость, airbnb и т.д.).




Губернатор Санкт-Петербурга Александр Беглов
Москва

Сергей Собянин поздравил москвичей с Днем молодежи





Москва

В Воскресенске росгвардейцы задержали гражданку, находящуюся в федеральном розыске


Губернатор Санкт-Петербурга Александр Беглов

103news.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.

Moscow.media
Москва

Собянин: Москва всегда поможет молодежи в покорении новых вершин



103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Земфира

С Земфиры* суд взыскал долги за коммуналку




Спорт в Санкт-Петербурге

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

Евгения Овод проиграла Дарье Войт в 3-м туре Высшей лиги в Нижнем Новгороде, а чемпионка Санкт-Петербурга по шахматам Ольга Карманова победила Участницу Суперфинала – 2023

Заполярная команда представит регион в четвертьфинале Центральной лиги КВН в Санкт-Петербурге

30-летие Аниша Гири обернулось «ничейным» туром на шахматном супертурнире в Бухаресте, среди участников которого – и Ян Непомнящий


Уимблдон

Теннисистка Анастасия Тихонова вышла в ½ финала квалификации Уимблдона



Новости Крыма на Sevpoisk.ru


Настроение

Ума палата: в Красноярском крае педофил пожаловался на вымогательство в полицию - и сам попал под проверку



Частные объявления в Санкт-Петербурге, в Ленинградской области и в России