Москва
Мероприятия
Блог
Войти
main-bg
Блог

Кейс: Исследование свойств портландцемента методами дейта майнинга

Исходное сырье, поставщики, дробление сырья, тонкий помол компонентов, температура обжига сырьевой смеси, расход электроэнергии оказывают существенное влияние на качество и стоимость продукта. Параметрами портландцемента являются гранулометрический состав, размер, удельная поверхность частиц (см2/г), густота, равномерность изменения объема, химический и минералогический состав. Качество продукта оценивается по следующим ключевым показателям: предел прочности на сжатие и изгиб, равномерность изменения в процессе гидратации и др. Тонкость помола характеризуется величиной остатка порошка и величиной прохода порошка сквозь сито, удельной поверхностью зерен, гранулометрическим составом.

Измеряемые показатели: начало схватывания, конец схватывания, тонкость помола, коррозийная стойкость, огнеупорность, гидрофорбность и др. Предел прочности при сжатии определяется стандартом в возрасте 2 и 28 суток. С помощью классических статистических методов и технологий дейта майнинга, включая CART модели (деревья классификации и регрессии), строятся предсказательные модели зависимости скорости схватывания, пределов прочности на сжатие и изгиб от компонент портландцемента. Построенные модели позволяют оптимизировать технологический процесс, повысить качество продукции.


Данный кейс подробно разбирается на курсе Академии Анализа Данных "Мониторинг и анализ производственных процессов: методология, технология, кейсы"


Постановка задачи

Рассматривается важная практическая задача – установление зависимости между компонентами портландцемента и выделяющимся теплом при его отвердевании. Имеются табличные результаты экспериментального исследования тепла, выделяющегося про отвердевании портландцемента. Данные устанавливают связь между количеством четырех компонент (3CaO·Al2O3, 3CaO·SiO2, 4CaO·Al2O3·Fe2O3, 2CaO·SiO2) в клинкерах, из которых изготовлен цемент, и выделившимся теплом.

Исходные данные

Независимые переменные (предикторы):

  • X_1 – количество трикальций-алюмината 3CaO·Al2O3;
  • Х_2 – количество трикальций-силиката 3CaO·SiO2;
  • Х_3 – количество тетракальций-алюминиум-феррита 4CaO·Al2O3·Fe2O3;
  • Х_4 – количество дикальций-силиката 2CaO·SiO2

Зависимая переменная: Y = X_5 – выделившееся тепло в калориях на грамм цемента;

X_1, X_2, X_3 и X_4 измеряются в процентах от веса клинкера, из которого производится цемент.

Исходные данные

 

Из первой строки таблицы, например, видно, что при значениях Х_1 = 7, Х_2 = 26, Х_3 = 6, Х_4 = 60 выделяется 78,5 калорий тепла.

Из третьей строки видно, что при значениях Х_1 = 11, Х_2 = 56, Х_3 = 8, Х_4 = 20 выделяется 104,3 калории тепла.

 

Для повышения качества цемента важно найти зависимость между компонентами цемента и выделяющимся теплом. Предсказательные модели можно построить в ряде модулей STATISTICA, мы начнем работать в модуле множественная регрессия.

Модуль «Множественная регрессия»

В меню «Анализ» выбираем модуль «Множественная регрессия» и запускаем его.

В открывшемся диалоговом окне нажимаем на кнопку «Переменные»: в качестве зависимой переменной выбираем X_5, в качестве независимых – X_1, X_2, X_3 и X_4. Во вкладке «Дополнительно» ставим галочку напротив «Пошаговая или гребневая регрессия». С помощью этой опции можно автоматизировать процесс выбора наиболее информативной в смысле R2 (доля объясненной дисперсии) модели регрессии.

   

 

Далее откроется диалоговое окно «Определение модели». В строке «Процедура» выбираем «Пошаговая с включением».

Нажимаем «ОК», программа проведет вычисления и выдаст окно результатов, поеказанное ниже.

Результаты регрессии

Просмотрим это окно, двигаясь сверху вниз. В верхней части окна приведены:

  • название зависимой переменной, число наблюдений;
  • коэффициент множественной корреляции, коэффициент детерминации R2, скорректированный R2;
  • значение F-статистики для проверки гипотезы H0: линейная связь между зависимой и независимыми переменными отсутствует,
  • степени свободы распределения Фишера сс, уровень значимости р, соответствуюший F-статистике;
  • стандартная ошибка оценки, значение свободного члена, значение t-статистики для проверки гипотезы о равенсте свободного члена нулю, соответствующий уровень значимости p.

Итоговая таблица

Нажимаем кнопку «Итоговая таблица регрессии» для просмотра таблиц:

   

Из таблицы «Итоговые статистики» следует, что значение коэффициента детерминации R2 близко к 1, а p-значение меньше 0,05, значит модель регрессии (коэффициенты взяты из столбца «В» таблицы «Итоги регрессии для зависимой переменной»)

X_5 = 71,64831 + 1,45195·X_1 + 0,41611·X_2 – 0,23654·X_4

признается значимой, и очень хорошо объясняет дисперсию переменной X_5.

В столбце «t(9)» стоят значения статистики Стьюдента для проверки гипотезы о равенстве нулю соответствующего коэффициента, а в столбце «р-знач.» - соответствующие уровни значимости отклонения этой гипотезы. Достаточно малым этот уровень является только для коэффициента при X_1. В то же время данная модель наиболее информативная в смысле R2, значит она информативней, чем модель с одним регрессором X_1. Это говорит о том, что следуют продолжить изучение линейной связи между X_5 и (X_1, X_2, X_3, X_4), анализируя как их содержательный смысл, так и матрицу парных корреляций.

Анализ нормальности остатков

Дополним результаты регрессии анализом нормальности остатков. Для этого перейдем во вкладку «Остатки/предсказанные/наблюдаемые значения» диалогового окна «Результаты множественной регрессии». Далее нажимаем кнопку «Анализ остатков», а в появившемся окне на вкладке «Диаграммы рассеяния» нажимаем кнопку «Предсказанные и остатки». Также следует построить «Гистограмму остатков», которая находится во вкладке «Остатки» диалогового окна «Анализ остатков», и «Нормальный график остатков», который находится во вкладке «Вероятностные графики». Имеется всего 13 наблюдений, гистограмма остатков и нормальный график остатков никакой существенной информации не дадут.

График «Предсказанные значения и остатки» говорит о несмещенности оценки остатков:

Парные корреляции

Перейдем во вкладку «Остатки/предсказанные/наблюдаемые значения». Далее нажимаем кнопку «Описательные статистики», а в появившемся окне на вкладке «Быстрый» или «Дополнительно» нажимаем кнопку «Корреляции».

 

Из матрицы видно, что переменные X_2 (трикальций-силикат 3CaO·SiO2) и X_4 (дикальций-силикат 2CaO·SiO2) сильно коррелированны. Имеет место дублирование информации, и потому, по-видимому, есть возможность перехода от исходного числа признаков (переменных) к меньшему числу, иными словами, сократить размерность задачи.

Сравнение моделей с регрессорами (X_1, X_2) и (X_1, X_4)

Рассмотрим две регрессионные модели: 1) с регрессорами X_1, X_2; 2) с регрессорами X_1, X_4. Опять воспользуемся модулем «Множественная регрессия». В качестве зависимой переменной выбираем X_5, а в качестве независимых в первом случае X_1 и X_2, а во втором случае X_1 и X_4.

Проделаем уже описанные шаги для этих моделей и получим следующие результаты:

1). регрессоры X_1, X_2:

          

Уравнение регрессии: X_5 = 52,57735 + 1,46831·X_1 + 0,66225·X_2

           График «Предсказанные значения и остатки»:

2). регрессоры X_1, X_4:

     

Уравнение регрессии: X_5 = 103,0974 + 1,4400·X_1 - 0,6140·X_4

График «Предсказанные значения и остатки»:

 

Как мы видим, в обеих моделях коэффициент детерминации R2(0,978678375 и 0,972471048) близок к коэффициенту детерминации (0,982335451) в модели с тремя регрессорами (X_1, X_2, X_4), но в этих моделях оба коэффициента при регрессорах значимы. Распределение точек на графиках «Предсказанные значения и остатки» говорит о несмещенности оценкок ошибок. Поэтому следует отдать предпочтение модели с двумя регрессорами, а именно с X_1 и X_2, так как R2 в этом случае больше, чем в модели с регрессорами X_1, X_4.

Таблица предсказанных значений

Приведем таблицу предсказанных значений и остатков для выбранной модели с регрессорами X_1, X_2. Для этого перейдем во вкладку «Остатки/предсказанные/наблюдаемые значения» диалогового окна «Результаты множественной регрессии». Далее нажимаем кнопку «Анализ остатков», а в появившемся окне на вкладке «Быстрый» или «Дополнительно» нажимаем кнопку «Остатки и предсказанные». Получаем следующую таблицу:

Выводы

На основе проведенного регрессионного анализа была построена предсказательная модель: X_5 = 52,57735 + 1,46831·X_1 + 0,66225·X_2. В отличие от моделей с большим числом регрессоров, в данной модели все коэффициенты являются значимыми на уровне α = 0,05. Также данная модель является наилучшей в смысле R2 среди моделей с не более чем двумя регрессорами. Однако, анализ показал, что есть модели с очень близкими значениями коэффициентов детерминации и объясненной дисперсии, поэтому окончательный выбор модели следует делать исходя из дополнительной информации, наример физической природе переменных и их характерных особенностях. С помощью методов дейта майнинга и машинного обучения можно построить выскоточные модели определения характеристик материалов от состава и параметра технологических процессов.


Более подробно методы предиктивной аналитики в приложении к изготовлению современных материалов излагаются в курсе Академии "Мониторинг и анализ производственных процессов: методология, технология, кейсы"


 

 

 

Литература

  1. Боровиков В. П., Ивченко Г. И. Прогнозирование в системе STATISTICA в среде Windows. Основы теории и интенсивная практика на компьютере. – М.: Финансы и статистика, 1999.
  2. Боровиков В. П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. 3-е изд. – СПб.: Питер, 2003
  3. Хальд А. Математическая статистика с техническими приложениями

 

 

 

 

Теги:

Новости, истории и события
Смотреть все
ENTERCHAIN fabricaONE.AI  (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках
Новости

ENTERCHAIN fabricaONE.AI (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках

24.06.2026

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными
Новости

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными

24.06.2026

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России
Новости

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России

23.06.2026

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий
Новости

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий

23.06.2026

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026
Новости

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026

23.06.2026

ПАО «Софтлайн» продолжит обратный выкуп акций Компании
Новости

ПАО «Софтлайн» продолжит обратный выкуп акций Компании

22.06.2026

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026
Новости

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026

22.06.2026

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА
Новости

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА

22.06.2026

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck
Новости

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck

22.06.2026

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»
Новости

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»

19.06.2026

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой
Новости

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой

19.06.2026

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций
Новости

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций

19.06.2026

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга
Новости

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга

18.06.2026

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes
Новости

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes

18.06.2026

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации
Новости

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации

18.06.2026

ГК Softline представит в Иркутске цифровую лабораторию для подготовки будущих инженеров
Новости

ГК Softline представит в Иркутске цифровую лабораторию для подготовки будущих инженеров

17.06.2026

Академия АйТи fabricaONE.AI (акционер – ГК Softline) и АНО «Астра Академия» пилотируют профессиональную сертификацию ИТ-специалистов для студентов
Новости

Академия АйТи fabricaONE.AI (акционер – ГК Softline) и АНО «Астра Академия» пилотируют профессиональную сертификацию ИТ-специалистов для студентов

16.06.2026

ГК Softline запустила модуль расширенного логирования для платформы BPMSoft
Новости

ГК Softline запустила модуль расширенного логирования для платформы BPMSoft

16.06.2026

Почему промышленный ИИ остается локальным инструментом — и что с этим делать
Блог

Почему промышленный ИИ остается локальным инструментом — и что с этим делать

18.06.2026

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox
Блог

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox

11.06.2026

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора
Блог

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора

09.06.2026

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ
Блог

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ

04.06.2026

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений
Блог

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений

01.06.2026

Главные ИТ-новости недели 29.05.2026
Блог

Главные ИТ-новости недели 29.05.2026

29.05.2026

ИИ в образовании 2026: практика, инфраструктура, регулирование
Блог

ИИ в образовании 2026: практика, инфраструктура, регулирование

22.05.2026

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов
Блог

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов

19.05.2026

Как меняется инфраструктура образования: опыт российских школ
Блог

Как меняется инфраструктура образования: опыт российских школ

13.05.2026

Главные ИТ-новости недели 08.05.2026
Блог

Главные ИТ-новости недели 08.05.2026

08.05.2026

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов
Блог

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов

06.05.2026

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике
Блог

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике

29.04.2026

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения
Блог

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения

22.04.2026

Лицензионный хаос: как избежать штрафов и навести порядок в ПО
Блог

Лицензионный хаос: как избежать штрафов и навести порядок в ПО

21.04.2026

Информационная безопасность в проектах «Софтлайн Решений»
Блог

Информационная безопасность в проектах «Софтлайн Решений»

17.04.2026

Главные ИТ-новости недели 10.04.2026
Блог

Главные ИТ-новости недели 10.04.2026

10.04.2026

Цифровые технологии на производстве: от кибербезопасности до облаков — опыт компаний
Блог

Цифровые технологии на производстве: от кибербезопасности до облаков — опыт компаний

08.04.2026

Первый российский PDF-редактор с ИИ-ассистентом: обзор функций
Блог

Первый российский PDF-редактор с ИИ-ассистентом: обзор функций

06.04.2026