Поиск по сайту Поиск

Как собирать и обрабатывать в облаке данные о 350 млн товаров в день: кейс Sellematics

В кейсе делимся опытом масштабирования в облаке сервиса аналитики и исследований для eCommerce — Sellematics.

Как собирать и обрабатывать в облаке данные о 350 млн товаров в день

О клиенте

Sellematics — ведущий российский сервис аналитики в сфере e-commerce. Компания помогает мировым брендам и дистрибьюторам отслеживать динамику цен, репутацию и представленность на более чем 20 российских онлайн площадках. Компании также принадлежит сервис Sellmonitor, который помогает большим и маленьким селлерам увеличивать продажи, управлять рекламой и поставками на маркетплейсах.

Кроме того, компания предоставляет услуги аналитики в Е-соm на рынке KHP в рамках сервиса Sellscreen.io.

Задачи

→ Обеспечить стабильное и быстрое соединение.

→ Гарантировать высокую производительность и высокую скорость вычислений.

→ Гарантировать надежное хранение и защиту данных объемом в несколько десятков терабайт.

Как собирать и обрабатывать в облаке данные о 350 млн товаров в день

Помимо этого Sellematics важно иметь возможность масштабировать ресурсы при необходимости — объем обрабатываемых данных растет, поэтому клиенту нужны производительные и надежные решения на рынке. Важно, чтобы техническая поддержка оперативно помогала с настройкой серверов и решала возникающие вопросы. 

Решение

Sellematics сотрудничает с Рег.ру с момента основания. В 2019 году компания арендовала 5 физических серверов. Сейчас компания использует современную DevOps-инфраструктуру, которая обеспечивает стабильность и высокую производительность работы платформы. В основе лежат более 20 высокопроизводительных физических серверов, высокоскоростные NVMe накопители Enterprise-класса.

По запросу клиента специалисты Рег.ру организовали серверное пространство так, чтобы физические серверы в стойках были поделены на конкретные группы. Так, в рамках одной группы все серверы имеют одни и те же характеристики, тот же набор дисков, процессоров и так далее. Такой подход позволяет унифицировать ИТ-инфраструктуру, упростить настройку и замену серверов. 

Результаты

Как собирать и обрабатывать в облаке данные о 350 млн товаров в день

Сегодня Sellematics обрабатывает данные о 350 млн товаров в день на маркетплейсах: 

  • изменение стока — количество доступного к продаже товара на конкретном складе;
  • изменения цен по дням для вычисления объема продаж каждого товара в штуках и деньгах по каждому дню;
  • информацию о продажах, поведении покупателей, рейтингах товаров, представленности товаров в категориях и поисковых запросах. 

Сервис использует API маркетплейсов, веб-скрейпинг и собственные датчики для сбора актуальных данных. На основании полученных данных Sellematics анализирует тренды, выявляет сезонность, строит прогнозы будущих продаж, спроса и поведения рынка. Пользователи получают персонализированные рекомендации по управлению ассортиментом, ценообразованию и маркетинговым стратегиям.

За счет использования мощных облачных серверов, Sellematics может за несколько минут увеличивать или уменьшать вычислительные мощности в зависимости от текущей нагрузки — это критически важно при работе с большими данными и выполнении аналитических расчетов и генерации прогнозов. 

Диски Enterprise-класса обеспечивают высокую скорость операций и надежность хранения информации, позволяют проводить большое количество операций записи без риска потери данных. А стабильный канал связи 800 Мбит/с помогает оперативно получать данные и обрабатывать их без задержек.

В ближайшем будущем компания планирует масштабировать ресурсы, чтобы увеличить количество обрабатываемых в сутки товаров до 500 млн единиц. 

Почему выбрали Рег.ру

Широкий выбор серверов. Гибкий подход к управлению ресурсами и оптимизации расходов на IT-инфраструктуру.

Техническая поддержка 24/7. Специалисты Рег.ру готовы оказать помощь в решении любых вопросов, включая поддержку в настройке серверов. 

Гибкое масштабирование и конфигурирование. Масштабируемая инфраструктура, с которой легко адаптировать ресурсы под растущие потребности рынка и обеспечить бесперебойную работу платформы.

Распределенная сеть ЦОД. Дата-центры компании соответствуют уровню надежности и отказоустойчивости Tier III. За счет дублирования всех систем и двойному резервированию аптайм составляет 99,98%.

Производительные системы хранения данных. Использование дисков Enterprise-класса повышает IOPS и сокращает время отклика, что критически важно при работе с Big Data. 

Отзыв клиента

Технический директор Sellematics, Антон Злотников

«Отказоустойчивая ИТ-инфраструктура позволяет нам оперативно собирать и обрабатывать данные без задержек, а также рассчитывать и агрегировать большие объемы метрик и показателей. Уже сегодня мы ежедневно обрабатываем более 350 млн товаров с российских площадок, а в ближайшее время планируем масштабировать ресурсы, чтобы увеличить количество до 500 млн в сутки.»

Антон Злотников, технический директор Sellematics

Что такое Grafana

У современной компании есть тысячи различных показателей, которые она получает из различных источников. Grafana ― это программа, которая может объединить...
Read More

Что такое бизнес-аналитика

Любой бизнес ― это, в первую очередь, цифры: доходы, расходы, налоги, инвестиции и многие другие показатели. Разобраться в них поможет...
Read More

Тестирование гипотез: методы и инструкция

У каждого руководителя бизнеса есть сотни идей, которые он хочет воплотить. Но нет никаких гарантий того, что в итоге идея...
Read More

Все об искусственном интеллекте

Искусственный интеллект (ИИ) ― самая горячая тема для обсуждения последние несколько лет. Всему виной необычайные успехи в этой области, связанные...
Read More

Что такое SaaS

SaaS (Software as a Service) позволяет пользователям получать доступ к приложениям через интернет. Вместо установки программ на локальных устройствах, SaaS...
Read More

Мессенджер Rocket.Chat: обзор, функции, установка

Работу в современной компании сложно представить без мессенджера: онлайн-общение с коллегами помогает быстрее решать вопросы, согласовывать материалы и сообщать новости...
Read More

Что такое хостинг для игровых серверов

Многие онлайн-игры позволяют запустить собственный сервер, чтобы играть с друзьями или зарабатывать деньги, подключая к серверу для всех желающих. Есть...
Read More

Что такое фотохостинг. 9 лучших сервисов для хранения ваших фотографий и картинок

Когда папка с фото на смартфоне начинает занимать большую часть свободного места, приходится задуматься о том, куда девать все эти...
Read More

Что такое файлообменник и 8 лучших из них

Каждый, кто хоть раз терял телефон или сталкивался с проблемами с жестким диском, задавал себе вопрос: почему я заранее не...
Read More

Что такое Joomla, для кого, примеры использования

Хотите создать свой веб-сайт или более эффективно управлять уже существующим? Рассматриваем возможности и преимущества системы управления контентом Joomla в различных...
Read More