Москва
Мероприятия
Блог
Корзина
Регистрация Войти
main-bg
Новости

Что нужно знать ритейлеру о Data Lake

Только мы более-менее определились с термином Big Data, как вокруг него образовалось еще несколько понятий, которые нам так или иначе придется осмыслить и принять. Одно из них – Data Lake: все чаще этот термин встречается в контексте систем хранения больших данных. Что это такое и что стоит знать об этом ритейлеру? На эти вопросы отвечает Станислав Воронин, руководитель направления внедрений систем бизнес-аналитики департамента бизнес-решений ГК Softline.

Существует много разных определений понятия «озеро данных». Если кратко, то Data Lake – место хранения, способ организации хранения больших данных и их обработки. Несмотря на бурное развитие технологий Big Data и Business Intelligence, специалисты не перестают искать более эффективные способы анализа данных.

Технология работы с большими данными Data Lake приходит на смену классическим корпоративным хранилищам данных. Корпоративное хранилище данных – это технология хранения данных, строящаяся по принципу сверху вниз – от запросов бизнеса. Например, руководство хочет видеть конкретные отчеты. Следовательно, структура хранения данных и процедура их получения подстраивается под этот запрос: ищется решение, каким образом нужно хранить данные, чтобы получить необходимый отчет.

Если приводить примеры из индустрии ритейла, то для розницы это будут внутренние исторические данные, такие как информация о транзакциях, совершенных в торговой сети за определенный период времени в прошлом. В рамках Data Lake как методологии структура имеет вид «снизу вверх». Так происходит потому, что структура данных, которые мы соберем в будущем, нам досконально неизвестна. Например, мы не знаем, что именно будет пользоваться повышенным спросом завтра, но можем это предсказать. Ведь для того, чтобы оставаться конкурентоспособными, ритейлеры должны анализировать не только прошлое поведение клиентов (что покупали, какие были тренды, что было хитом продаж, что не было и т.д.), но и стараться предугадывать покупательское поведение, предсказывать волны спроса, заранее прогнозировать товары-хиты – словом, делать все, чтобы выстраивать стратегию взаимодействия с покупателями и зарабатывать больше денег.

В корпоративных хранилищах, как правило, находится информация о транзакциях, уже совершенных в торговой сети (заказы, платежи, кассовые чеки). Если же мы говорим про Data Lake, то помимо внутренней информации, там находится внешняя – активность клиента в социальных сетях, действия клиента интернет-магазина – куда он кликал, какие товары смотрел и т.д. Хранилища Data Lake позволяют также накапливать и обрабатывать потоковую информацию: информацию с различных датчиков, логи событий, потоковое видео. Так, ритейлер может, например, осуществлять привязку покупок к конкретным покупателям, используя технологии распознавания лица. Это позволяет решать такие задачи, как, например: определение эмоций покупателя, определение членов одной семьи, выявление случаев мошенничества или кражи. Все это позволяет предоставлять наилучшее качество услуг и еще лучше таргетировать маркетинговые предложения.

Таким образом, если ритейлеру необходимо анализировать лишь историческую информацию, достаточно и классических корпоративных хранилищ данных. Если же он хочет предугадывать те или иные тренды или события, то ему будет недостаточно этого подхода – необходима дополнительная информация по текущим активностям покупателей в социальных сетях, их реакции на рекламные кампании тех или иных продуктов, информация о предзаказах, сообщения на форумах и т.д.

Для ритейлера, претендующего на лидерство, интересна, прежде всего, предиктивная (предсказательная) аналитика, которую способна предоставить технология Data Lake.

Как пользоваться Data Lake

Data Lake – это технология, которая доступна только в облаках по подписке. «Озера данных» – это файловая система и набор инструментов для обработки данных и обычно создаются на основе технологий обработки «больших данных» («Big data»), таких как Hadoop и Spark. Имеющаяся у Microsoft платформа Azure Data Lake позволяет использовать эти и другие решения big data для обработки данных любого формата и объема. Этой технологией можно воспользоваться как услугой по мере возникновения потребностей. Кроме того, конфигурация решения легко изменяется в любой момент времени для более точного соответствия потребностям клиента и обеспечения полного контроля за расходами.

Область применения этой технологии достаточно широка. Но сразу отмечу, работать с Data Lake сможет только грамотный data scientist – эксперт по работе с данными, аналитик. И у ритейлера должны быть такие люди в команде, поскольку в Data Lake не существует каких-то преднастроенных шаблонных решений. Формирование технического облика конкретного решения – каждый раз вопрос анализа потребностей конкретного заказчика.

Какие задачи может решить ритейлер c помощью Data Lake

  1. Предсказание динамики изменения спроса на те или иные группы товаров.
  2. Повышение эффективности персонифицированных предложений. Предсказание отклика на персональные маркетинговые предложения – когда ритейлер не всем подряд предлагает одну и ту же скидку, а делает это точечно (кому-то скидку, кому-то подарок, кому-то дополнительные бонусы на карту и т.д.)
  3. Выявление мошенничества как со стороны покупателей, так и со стороны работников.
  4. Повышение качества обслуживания

Для повышения эффективности персонификации необходимо строить модели, которые определяют эффективность той или иной коммуникации и смогут предсказать, к каким клиентам с какой коммуникацией идти. Для того, чтобы строить модели, которые будут оценивать персонифицированное взаимодействие на потребителя, ритейлер должен проводить определенную сегментацию, кластеризацию групп покупателей. При этом ключевой критерий сегментирования – не просто разделение покупателей по возрасту, полу и территориальной принадлежности, а разделение на группы, которые обладают устойчивыми характеристиками, отличающими их от других сегментов (как правило, это поведенческие характеристики).

Как происходит работа с данными?

Для начала необходимо наполнить систему данными. Ритейлер должен иметь информацию о своих клиентах, хотя бы минимальный ее набор – скажем, email и номер телефона. Существуют специальные технологии по сбору данных о потребителях, и это не имеет отношения к Data Lake, потому что «озеро» – это инструмент накопления, хранения и обработки данных.

Инструменты по сбору данных могут собирать информацию о покупателях из внешних источников – например, из социальных сетей – мониторить, на какие сайты покупатель ходит, какие товары смотрит и заказывает, насколько он вообще активен в интернете.

Существуют методики, которые на основании самого базового набора данных позволяют осуществлять их кластеризацию. С помощью методики можно выделить сегменты, просто применив их к базовому набору свойств и характеристик данных. Вариантов сегментации получается достаточно много, и задача аналитика – выбрать наиболее релевантные конкретному виду бизнеса сегменты и решить, как с ними дальше работать. Соответственно, симбиоз экспертизы аналитика и действующих технологий позволяет выделить сегменты клиентов.

Затем эта информация отправляется в «озеро данных» и проводится анализ активностей того или иного кластера на основании данных, которые есть в Data Lake. То есть вся информация, накапливаемая бизнесом, стекается в Data Lake, хранится там и анализируется. Именно эта технология может позволить найти скрытые закономерности, которые дадут бизнесу новые возможности.

Технология, например, позволяет соотносить данные о транзакциях и информацию по кликам покупателей (куда кликают, когда уходят, когда положили товар в корзину и ушли или, наоборот, положили товар в корзину и купили) — все это анализируется и помогает решать проблемы с конверсией, дает понимание, что нужно делать, чтобы пользователь не бросал товары в корзине. Например, при наличии номера телефона покупателя можно отправить ему SMS-напоминание о товарах в корзине и посоветовать посмотреть что-то еще, если товары ему все-таки не подошли.

Также можно анализировать поведение покупателя в прошлом для предсказывания его поведения в будущем, что позволяет выстроить более точечную коммуникацию.

Как не превратить «озеро» в помойку

Действительно, в Data Lake, как правило, хранится избыточная информация. Тем не менее она не является «помойкой» – все потоки данных (социальные сети, действия на сайтах, транзакции) лежат обособленно и не связаны с друг с другом. Порядок при формировании Data Lake поддерживается специалистом по анализу данных.

Как это работает на практике

Технология Data Lake уже используется в России. Компанией Softline реализован проект для одного из российских ритейлеров по предсказанию эффективности маркетинговых предложений. Разработанная модель использует данные об истории покупок клиентов и их откликах на предыдущие кампании, а также обогащенные данные о профиле клиента, собранном на основе активности в социальных сетях и интернете, хранящиеся в Azure Data Lake. Ключевыми результатами проекта стало снижение маркетингового бюджета на 30% при росте конвертации контактов в заказы более чем в 2 раза.

Новости, истории и события
Смотреть все
«Инферит» (кластер «СФ ТЕХ» ГК Softline) и Новосибирский национальный исследовательский государственный университет заключили соглашение о сотрудничестве в сфере искусственного интеллекта
Новости

«Инферит» (кластер «СФ ТЕХ» ГК Softline) и Новосибирский национальный исследовательский государственный университет заключили соглашение о сотрудничестве в сфере искусственного интеллекта

01.09.2025

Компания SL Soft FabricaONE.AI (акционер — ГК Softline) представляет ИИ-ассистента линейки продуктов Citeck
Новости

Компания SL Soft FabricaONE.AI (акционер — ГК Softline) представляет ИИ-ассистента линейки продуктов Citeck

29.08.2025

Softline Security Summit 2025: ГК Softline обсудила с лидерами ИБ-рынка и заказчиками актуальные вопросы кибербезопасности
Новости

Softline Security Summit 2025: ГК Softline обсудила с лидерами ИБ-рынка и заказчиками актуальные вопросы кибербезопасности

29.08.2025

«Софтлайн Решения» (ГК Softline) разработала инструмент для упрощения и ускорения интеграции платформы Directum RX с другими системами
Новости

«Софтлайн Решения» (ГК Softline) разработала инструмент для упрощения и ускорения интеграции платформы Directum RX с другими системами

28.08.2025

Роботизированный комплекс для лазерной сварки производителя лазерных решений VPG LaserONE (кластер «СФ ТЕХ» ГК Softline) включен в реестр российской промышленной продукции
Новости

Роботизированный комплекс для лазерной сварки производителя лазерных решений VPG LaserONE (кластер «СФ ТЕХ» ГК Softline) включен в реестр российской промышленной продукции

27.08.2025

Компания MAINTEX FabricaONE.AI (акционер – ГК Softline) приступила к выполнению работ по совершенствованию ремонтной практики на руднике «Октябрьский» Норильского Никеля
Новости

Компания MAINTEX FabricaONE.AI (акционер – ГК Softline) приступила к выполнению работ по совершенствованию ремонтной практики на руднике «Октябрьский» Норильского Никеля

27.08.2025

«Софтлайн Решения» (ГК Softline) и «Перспективный мониторинг» открыли центр киберучений Ampire в Российском университете транспорта
Новости

«Софтлайн Решения» (ГК Softline) и «Перспективный мониторинг» открыли центр киберучений Ampire в Российском университете транспорта

27.08.2025

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и компания «Цифровые технологии» подтвердили совместимость ОС «МСВСфера АРМ» 9 и «КриптоАРМ ГОСТ» 3 для шифрования на рабочих станциях
Новости

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и компания «Цифровые технологии» подтвердили совместимость ОС «МСВСфера АРМ» 9 и «КриптоАРМ ГОСТ» 3 для шифрования на рабочих станциях

26.08.2025

Подтверждена совместимость продуктов «Цитрос» от SL Soft FabricaONE.AI (акционер – ГК Softline) и операционной системы РЕД ОС 8
Новости

Подтверждена совместимость продуктов «Цитрос» от SL Soft FabricaONE.AI (акционер – ГК Softline) и операционной системы РЕД ОС 8

25.08.2025

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и ГК «Катюша» подтвердили совместимость ОС «МСВСфера АРМ» 9 и печатной техники «Катюша»
Новости

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и ГК «Катюша» подтвердили совместимость ОС «МСВСфера АРМ» 9 и печатной техники «Катюша»

25.08.2025

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и OpenYard подтверждают совместимость ОС «МСВСфера Сервер» 9 с серверами OpenYard
Новости

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) и OpenYard подтверждают совместимость ОС «МСВСфера Сервер» 9 с серверами OpenYard

22.08.2025

ГК Softline и БФТ-Холдинг подписали соглашение о сотрудничестве
Новости

ГК Softline и БФТ-Холдинг подписали соглашение о сотрудничестве

21.08.2025

ПАО «СОФТЛАЙН» ПУБЛИКУЕТ ФИНАНСОВЫЕ РЕЗУЛЬТАТЫ ПО ИТОГАМ 6 МЕСЯЦЕВ 2025 ГОДА И ПОДТВЕРЖДАЕТ ПРОГНОЗ НА 2025 ГОД
Новости

ПАО «СОФТЛАЙН» ПУБЛИКУЕТ ФИНАНСОВЫЕ РЕЗУЛЬТАТЫ ПО ИТОГАМ 6 МЕСЯЦЕВ 2025 ГОДА И ПОДТВЕРЖДАЕТ ПРОГНОЗ НА 2025 ГОД

21.08.2025

Обновление «Цитрос Цифровой Платформы» от SL Soft FabricaOne.AI (акционер – ГК Softline): больше гибкости, безопасности и удобства
Новости

Обновление «Цитрос Цифровой Платформы» от SL Soft FabricaOne.AI (акционер – ГК Softline): больше гибкости, безопасности и удобства

20.08.2025

ГК Softline и OXYGEN заключили стратегическое партнерство в сфере облачных решений
Новости

ГК Softline и OXYGEN заключили стратегическое партнерство в сфере облачных решений

20.08.2025

ГК Softline на «ИТ-Пикнике»: инновации и экспертиза
Новости

ГК Softline на «ИТ-Пикнике»: инновации и экспертиза

19.08.2025

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) подтверждает совместимость ОС «МСВСфера АРМ» 9 и системы администрирования «РЕД АДМ»
Новости

«Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) подтверждает совместимость ОС «МСВСфера АРМ» 9 и системы администрирования «РЕД АДМ»

19.08.2025

ОС «МСВСфера» от «Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) признана лучшей российской серверной операционной системой
Новости

ОС «МСВСфера» от «Инферит ОС» (кластер «СФ ТЕХ» ГК Softline) признана лучшей российской серверной операционной системой

18.08.2025

Современные лазерные технологии в промышленности: анализ рынка и инновационных решений в 2025 году
Блог

Современные лазерные технологии в промышленности: анализ рынка и инновационных решений в 2025 году

25.08.2025

Российские операционные системы. Топ отечественных ОС 2025
Блог

Российские операционные системы. Топ отечественных ОС 2025

21.08.2025

Цифровые лаборатории, VR-анатомия и не только: современные медико-биологические классы
Блог

Цифровые лаборатории, VR-анатомия и не только: современные медико-биологические классы

13.08.2025

Практическое руководство по защите коммерческой тайны в России: пошаговые инструкции и правовые аспекты
Блог

Практическое руководство по защите коммерческой тайны в России: пошаговые инструкции и правовые аспекты

05.08.2025

Импортозамещение в 2025 году
Блог

Импортозамещение в 2025 году

01.08.2025

Искусственный интеллект для медицины: реалии 2025 года
Блог

Искусственный интеллект для медицины: реалии 2025 года

24.07.2025

Топ российских производителей ноутбуков 2025: специализация и ведущие модели
Блог

Топ российских производителей ноутбуков 2025: специализация и ведущие модели

21.07.2025

ИБ-консультанты: кто спасет бизнес от утечек и хакерских атак
Блог

ИБ-консультанты: кто спасет бизнес от утечек и хакерских атак

18.07.2025

TMS-системы: рациональный и интеллектуальный подход к управлению тестированием
Блог

TMS-системы: рациональный и интеллектуальный подход к управлению тестированием

17.07.2025

Востребованные ИТ-профессии в 2025 году
Блог

Востребованные ИТ-профессии в 2025 году

15.07.2025

Без паники: как управлять ИТ-инфраструктурой без SCCM
Блог

Без паники: как управлять ИТ-инфраструктурой без SCCM

07.07.2025

ЦОД: основные компоненты, классификация и системы безопасности
Блог

ЦОД: основные компоненты, классификация и системы безопасности

04.07.2025

Критическая информационная инфраструктура: все, что нужно знать о КИИ
Блог

Критическая информационная инфраструктура: все, что нужно знать о КИИ

01.07.2025

SimpleOne HRMS: автоматизация управления персоналом для повышения лояльности сотрудников и эффективности бизнеса
Блог

SimpleOne HRMS: автоматизация управления персоналом для повышения лояльности сотрудников и эффективности бизнеса

27.06.2025

Технологии умного города: от ИИ до RPA
Блог

Технологии умного города: от ИИ до RPA

25.06.2025

ГК Softline развивает наукоемкое ПО для инженерного анализа (САЕ)
Блог

ГК Softline развивает наукоемкое ПО для инженерного анализа (САЕ)

23.06.2025

Российские облачные сервисы: преимущества, особенности и выбор
Блог

Российские облачные сервисы: преимущества, особенности и выбор

20.06.2025

VPS: что это и когда он необходим бизнесу
Блог

VPS: что это и когда он необходим бизнесу

17.06.2025