Москва
Мероприятия
Блог
Войти
main-bg
Новости

Что нужно знать ритейлеру о Data Lake

Только мы более-менее определились с термином Big Data, как вокруг него образовалось еще несколько понятий, которые нам так или иначе придется осмыслить и принять. Одно из них – Data Lake: все чаще этот термин встречается в контексте систем хранения больших данных. Что это такое и что стоит знать об этом ритейлеру? На эти вопросы отвечает Станислав Воронин, руководитель направления внедрений систем бизнес-аналитики департамента бизнес-решений ГК Softline.

Существует много разных определений понятия «озеро данных». Если кратко, то Data Lake – место хранения, способ организации хранения больших данных и их обработки. Несмотря на бурное развитие технологий Big Data и Business Intelligence, специалисты не перестают искать более эффективные способы анализа данных.

Технология работы с большими данными Data Lake приходит на смену классическим корпоративным хранилищам данных. Корпоративное хранилище данных – это технология хранения данных, строящаяся по принципу сверху вниз – от запросов бизнеса. Например, руководство хочет видеть конкретные отчеты. Следовательно, структура хранения данных и процедура их получения подстраивается под этот запрос: ищется решение, каким образом нужно хранить данные, чтобы получить необходимый отчет.

Если приводить примеры из индустрии ритейла, то для розницы это будут внутренние исторические данные, такие как информация о транзакциях, совершенных в торговой сети за определенный период времени в прошлом. В рамках Data Lake как методологии структура имеет вид «снизу вверх». Так происходит потому, что структура данных, которые мы соберем в будущем, нам досконально неизвестна. Например, мы не знаем, что именно будет пользоваться повышенным спросом завтра, но можем это предсказать. Ведь для того, чтобы оставаться конкурентоспособными, ритейлеры должны анализировать не только прошлое поведение клиентов (что покупали, какие были тренды, что было хитом продаж, что не было и т.д.), но и стараться предугадывать покупательское поведение, предсказывать волны спроса, заранее прогнозировать товары-хиты – словом, делать все, чтобы выстраивать стратегию взаимодействия с покупателями и зарабатывать больше денег.

В корпоративных хранилищах, как правило, находится информация о транзакциях, уже совершенных в торговой сети (заказы, платежи, кассовые чеки). Если же мы говорим про Data Lake, то помимо внутренней информации, там находится внешняя – активность клиента в социальных сетях, действия клиента интернет-магазина – куда он кликал, какие товары смотрел и т.д. Хранилища Data Lake позволяют также накапливать и обрабатывать потоковую информацию: информацию с различных датчиков, логи событий, потоковое видео. Так, ритейлер может, например, осуществлять привязку покупок к конкретным покупателям, используя технологии распознавания лица. Это позволяет решать такие задачи, как, например: определение эмоций покупателя, определение членов одной семьи, выявление случаев мошенничества или кражи. Все это позволяет предоставлять наилучшее качество услуг и еще лучше таргетировать маркетинговые предложения.

Таким образом, если ритейлеру необходимо анализировать лишь историческую информацию, достаточно и классических корпоративных хранилищ данных. Если же он хочет предугадывать те или иные тренды или события, то ему будет недостаточно этого подхода – необходима дополнительная информация по текущим активностям покупателей в социальных сетях, их реакции на рекламные кампании тех или иных продуктов, информация о предзаказах, сообщения на форумах и т.д.

Для ритейлера, претендующего на лидерство, интересна, прежде всего, предиктивная (предсказательная) аналитика, которую способна предоставить технология Data Lake.

Как пользоваться Data Lake

Data Lake – это технология, которая доступна только в облаках по подписке. «Озера данных» – это файловая система и набор инструментов для обработки данных и обычно создаются на основе технологий обработки «больших данных» («Big data»), таких как Hadoop и Spark. Имеющаяся у Microsoft платформа Azure Data Lake позволяет использовать эти и другие решения big data для обработки данных любого формата и объема. Этой технологией можно воспользоваться как услугой по мере возникновения потребностей. Кроме того, конфигурация решения легко изменяется в любой момент времени для более точного соответствия потребностям клиента и обеспечения полного контроля за расходами.

Область применения этой технологии достаточно широка. Но сразу отмечу, работать с Data Lake сможет только грамотный data scientist – эксперт по работе с данными, аналитик. И у ритейлера должны быть такие люди в команде, поскольку в Data Lake не существует каких-то преднастроенных шаблонных решений. Формирование технического облика конкретного решения – каждый раз вопрос анализа потребностей конкретного заказчика.

Какие задачи может решить ритейлер c помощью Data Lake

  1. Предсказание динамики изменения спроса на те или иные группы товаров.
  2. Повышение эффективности персонифицированных предложений. Предсказание отклика на персональные маркетинговые предложения – когда ритейлер не всем подряд предлагает одну и ту же скидку, а делает это точечно (кому-то скидку, кому-то подарок, кому-то дополнительные бонусы на карту и т.д.)
  3. Выявление мошенничества как со стороны покупателей, так и со стороны работников.
  4. Повышение качества обслуживания

Для повышения эффективности персонификации необходимо строить модели, которые определяют эффективность той или иной коммуникации и смогут предсказать, к каким клиентам с какой коммуникацией идти. Для того, чтобы строить модели, которые будут оценивать персонифицированное взаимодействие на потребителя, ритейлер должен проводить определенную сегментацию, кластеризацию групп покупателей. При этом ключевой критерий сегментирования – не просто разделение покупателей по возрасту, полу и территориальной принадлежности, а разделение на группы, которые обладают устойчивыми характеристиками, отличающими их от других сегментов (как правило, это поведенческие характеристики).

Как происходит работа с данными?

Для начала необходимо наполнить систему данными. Ритейлер должен иметь информацию о своих клиентах, хотя бы минимальный ее набор – скажем, email и номер телефона. Существуют специальные технологии по сбору данных о потребителях, и это не имеет отношения к Data Lake, потому что «озеро» – это инструмент накопления, хранения и обработки данных.

Инструменты по сбору данных могут собирать информацию о покупателях из внешних источников – например, из социальных сетей – мониторить, на какие сайты покупатель ходит, какие товары смотрит и заказывает, насколько он вообще активен в интернете.

Существуют методики, которые на основании самого базового набора данных позволяют осуществлять их кластеризацию. С помощью методики можно выделить сегменты, просто применив их к базовому набору свойств и характеристик данных. Вариантов сегментации получается достаточно много, и задача аналитика – выбрать наиболее релевантные конкретному виду бизнеса сегменты и решить, как с ними дальше работать. Соответственно, симбиоз экспертизы аналитика и действующих технологий позволяет выделить сегменты клиентов.

Затем эта информация отправляется в «озеро данных» и проводится анализ активностей того или иного кластера на основании данных, которые есть в Data Lake. То есть вся информация, накапливаемая бизнесом, стекается в Data Lake, хранится там и анализируется. Именно эта технология может позволить найти скрытые закономерности, которые дадут бизнесу новые возможности.

Технология, например, позволяет соотносить данные о транзакциях и информацию по кликам покупателей (куда кликают, когда уходят, когда положили товар в корзину и ушли или, наоборот, положили товар в корзину и купили) — все это анализируется и помогает решать проблемы с конверсией, дает понимание, что нужно делать, чтобы пользователь не бросал товары в корзине. Например, при наличии номера телефона покупателя можно отправить ему SMS-напоминание о товарах в корзине и посоветовать посмотреть что-то еще, если товары ему все-таки не подошли.

Также можно анализировать поведение покупателя в прошлом для предсказывания его поведения в будущем, что позволяет выстроить более точечную коммуникацию.

Как не превратить «озеро» в помойку

Действительно, в Data Lake, как правило, хранится избыточная информация. Тем не менее она не является «помойкой» – все потоки данных (социальные сети, действия на сайтах, транзакции) лежат обособленно и не связаны с друг с другом. Порядок при формировании Data Lake поддерживается специалистом по анализу данных.

Как это работает на практике

Технология Data Lake уже используется в России. Компанией Softline реализован проект для одного из российских ритейлеров по предсказанию эффективности маркетинговых предложений. Разработанная модель использует данные об истории покупок клиентов и их откликах на предыдущие кампании, а также обогащенные данные о профиле клиента, собранном на основе активности в социальных сетях и интернете, хранящиеся в Azure Data Lake. Ключевыми результатами проекта стало снижение маркетингового бюджета на 30% при росте конвертации контактов в заказы более чем в 2 раза.

Новости, истории и события
Смотреть все
Акционеры ПАО «Софтлайн» в ходе Годового общего собрания приняли решение впервые выплатить дивиденды
Новости

Акционеры ПАО «Софтлайн» в ходе Годового общего собрания приняли решение впервые выплатить дивиденды

26.06.2026

ГК Softline и НГТУ НЭТИ объединяют усилия в подготовке ИТ-кадров
Новости

ГК Softline и НГТУ НЭТИ объединяют усилия в подготовке ИТ-кадров

25.06.2026

Bell Integrator FabricaONE.AI (акционер – ГК Softline) обеспечил доступность 99,99% критичным сервисам ведущего банка
Новости

Bell Integrator FabricaONE.AI (акционер – ГК Softline) обеспечил доступность 99,99% критичным сервисам ведущего банка

25.06.2026

ENTERCHAIN fabricaONE.AI  (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках
Новости

ENTERCHAIN fabricaONE.AI (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках

24.06.2026

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными
Новости

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными

24.06.2026

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России
Новости

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России

23.06.2026

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий
Новости

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий

23.06.2026

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026
Новости

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026

23.06.2026

ПАО «Софтлайн» продолжит обратный выкуп акций Компании
Новости

ПАО «Софтлайн» продолжит обратный выкуп акций Компании

22.06.2026

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026
Новости

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026

22.06.2026

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА
Новости

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА

22.06.2026

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck
Новости

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck

22.06.2026

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»
Новости

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»

19.06.2026

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой
Новости

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой

19.06.2026

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций
Новости

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций

19.06.2026

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга
Новости

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга

18.06.2026

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes
Новости

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes

18.06.2026

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации
Новости

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации

18.06.2026

Аутсорсинг ИТ. 10 задач, которые выгоднее передать внешнему партнеру
Блог

Аутсорсинг ИТ. 10 задач, которые выгоднее передать внешнему партнеру

26.06.2026

Как быстро купить лицензионное ПО: пошаговая инструкция
Блог

Как быстро купить лицензионное ПО: пошаговая инструкция

25.06.2026

Почему промышленный ИИ остается локальным инструментом — и что с этим делать
Блог

Почему промышленный ИИ остается локальным инструментом — и что с этим делать

18.06.2026

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox
Блог

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox

11.06.2026

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора
Блог

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора

09.06.2026

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ
Блог

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ

04.06.2026

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений
Блог

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений

01.06.2026

Главные ИТ-новости недели 29.05.2026
Блог

Главные ИТ-новости недели 29.05.2026

29.05.2026

ИИ в образовании 2026: практика, инфраструктура, регулирование
Блог

ИИ в образовании 2026: практика, инфраструктура, регулирование

22.05.2026

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов
Блог

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов

19.05.2026

Как меняется инфраструктура образования: опыт российских школ
Блог

Как меняется инфраструктура образования: опыт российских школ

13.05.2026

Главные ИТ-новости недели 08.05.2026
Блог

Главные ИТ-новости недели 08.05.2026

08.05.2026

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов
Блог

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов

06.05.2026

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике
Блог

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике

29.04.2026

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения
Блог

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения

22.04.2026

Лицензионный хаос: как избежать штрафов и навести порядок в ПО
Блог

Лицензионный хаос: как избежать штрафов и навести порядок в ПО

21.04.2026

Информационная безопасность в проектах «Софтлайн Решений»
Блог

Информационная безопасность в проектах «Софтлайн Решений»

17.04.2026

Главные ИТ-новости недели 10.04.2026
Блог

Главные ИТ-новости недели 10.04.2026

10.04.2026