Москва
Мероприятия
Блог
Корзина
Регистрация Войти
main-bg
Блог

Data mining: выбор приоритетов и нейронные сети

В течение последнего десятилетия в нефтегазовой отрасли произошла компьютеризация таких процессов, как управление бурением, каротаж высокого разрешения, телеметрия, сбор разнообразных данных на этапе разведки и эксплуатации и многих других. В этом материале мы сосредоточимся на новых аналитических технологиях для нефтедобывающей промышленности.

Построение моделей коллективных данных позволяет изменить способы анализа, моделирования процессов и в целом способствует оптимизации в отрасли. Многие прорывы в поиске месторождений произошли за счет сочетания геологии, петрофизики и геофизики. Сегодня на каждой пробуренной скважине размещены измерительные приборы, которые производят видео, изображения и структурированные данные. Это огромные массивы информации, самой разнообразной, всевозможных типов и масштабов.

Современные технологии data mining и машинного обучения позволяют работать с большими объемами данных, измеренных в разных шкалах: непрерывной, порядковой, категориальной, с разной частотой дискретизации. Классические методы статистики, имеющей дело с фиксированными наборами данных (выборками), устаревают и должны быть дополнены новыми интеллектуальными технологиями, поскольку подлинная революция в технологии анализа данных уже произошла.

Инженерам, работающим в нефтедобывающей промышленности, data mining дает ответы на многие ключевые вопросы, например:

  • в каком направлении следует бурить горизонтальную скважину, чтобы уменьшить риск осложнений;
  • как определить набор параметров, оказывающих максимальное влияние на возникновение осложнений;
  • какую технологию ВИР следует применять в тех или иных условиях;
  • как выбрать смеси для цементирования;
  • как выбрать адекватного поставщика и т.д.

Целевые переменные и атрибуты

Первым шагом в создании моделей data mining является определение целевых переменных (target variables) и факторов, влияющих на них. Целевая переменная в контексте машинного обучения – это переменная, которая описывает результат (цель) процесса. Например, 0 – нет осложнений, 1 – есть осложнения.

В анализе данных мы называем такую переменную откликом или зависимой переменной.

В более общей ситуации имеется несколько значений целевой переменной, указывающих на тип осложнений. Например, 0 – нет осложнений, 1 – есть осложнение типа 1, 2 – есть осложнение типа 2 и т.д.

Актуальной технологической задачей является определение набора параметров, которые оказывают максимальное влияние на возникновение осложнения. Для того, чтобы осуществить отбор атрибутов – то есть определить признаки, имеющие наиболее тесные связи с целевой переменной, – нужно задействовать практических работников, инженеров, технологов.

В качестве примера возьмем проект бурения. Разломы и трещины в породе приводят к потерям бурового раствора, тяжелый раствор может разорвать породу, слишком легкий раствор не позволяет подавлять газопроявление, а это приводит к выбросам. Вибрация колонны может повредить оборудование и привести к разрушениям.  Поэтому в проекте бурения должны быть учтены многие факторы, включая тип колонны, требования по закачиванию, предыстория и параметры бурового станка, подбор инструмента, оборудования, параметры цементирования и т.д. Ключевым моментом является взаимодействие факторов: они не только действуют на целевую переменную, но и взаимодействуют между собой. Так какие именно переменные следует включить в модель data mining?

Хорошая новость состоит в том, что специалисты в предметной области – инженеры и технологи – могут легко освоить нейросетевой инструмент для решения практических задач.

Итак, обратимся к технологии нейронных сетей.

Нейронные сети

Покажем, как строятся нейронные сети в программе STATISTICA, и убедимся, что делается это просто.

Весь анализ проводится в удобном диалоговом режиме, позволяя пользователю видеть основное направление исследования данных. Даже новичок в аналитике может сделать первые успешные шаги. В качестве примера будем прогнозировать наличие или отсутствие нефти по результатам спектрального анализа.

Шаг 1. Открываем структуру исходных данных

Рисунок 1. Предположим, структура выглядит следующим образом

Столбцы в таблице – это переменные, строки конкретные пробы. Целевой переменной является нефтеносность: наличие/отсутствие нефти (первая переменная). Также имеются переменные, описывающие параметры скважин.

Шаг 2. Начало моделирования. Открываем модуль «Нейронные сети Statistica», выбираем метод анализа.

Рисунок 2. Стартовое окно нейронных сетей Statistica

Целевая переменная принимает два значения: 0 и 1, поэтому выбираем метод классификации в разделе Анализ, нажимаем ОК.

Шаг 3. Выбираем переменные и задаем параметры анализа.

Прежде всего указываем, какие переменные являются целевыми, какие факторы влияют на нее. Переменная нефтеносность является целевой, остальные переменные независимые или входные. Задача в том, чтобы оценить, как входные переменные влияют на целевую переменную.

Рисунок 3. Окно выбора переменных

Шаг 5. В следующем окне выбираем подвыборки для обучения сети.

Рисунок 4. Задание подвыборок

Основные принципы обучения и критерии остановки

Это ключевой момент для понимания машинного обучения. Мы не можем обучать сеть до бесконечности, предъявляя все имеющиеся данные, сеть обучается до достижения минимума ошибок. Поэтому нужно разделить исходные данные на выборки: обучающую, контрольную, тестовую.

Отмечу, что эмпирический подход предполагает раннюю остановку процесса обучения сети, чтобы не допустить переобучения. Необходимо использовать набор валидаций для контроля точности обучения, это достигается с помощью контрольной выборки. Как только ошибка на выборке, контролирующей обучение, начинает возрастать, процесс обучения прекращается.

Тестовая выборка провидит проверку построенной и обученной сети, т.е. сети с найденными параметрами, на отдельном тестовом множестве.

Сеть обучается на выборке, составляющей обычно 70% наблюдений, процесс обучения контролируется на контрольной выборке (15% процентов наблюдений), построенная сеть проверяется на тестовой выборке (также 15% процентов наблюдений).

В отдельной вкладке можно выбрать тип сети, количество сетей для обучения и сохранения, функцию ошибок. Обычно используется сумма квадратов отклонений наблюдаемых и предсказанных значений, а также кросс-энтропия.

Рисунок 5. Окно спецификаций сетей

В этом диалоговом окне можно выбрать радиальные базисные функции и многослойные персептроны. Архитектура многослойных персептронов включает три вида нейронных слоёв: входной слой – NeuralInputs, скрытый слой – Hidden_NeuralLayer и выходной слой – NeuralOutputs.

Поток информации проходит от входных нейронов к выходным, формируя результат анализа.

В первых опытах с сетями рекомендуется использовать предопределенные настройки, которые впоследствии можно изменить, например, увеличить сложность сети, изменить число скрытых нейронов в многослойном персептроне, выбрать различные функции активации.

После того как основные параметры сети выбраны, запускаем процесс обучения.

Результаты определения нефтеносности на обучающей выборке показаны на рис. 6.

Рисунок 6. Результаты классификации

В этой таблице показана сеть MLP – многослойный персептрон, имеющий 173 входа и результаты сети на обучающей выборке.

Итак, сеть построена, вы оценили качество ее работы, теперь ее можно сохранить и использовать в деле!

Уверен, работа с нейронными сетями Statistica доставит вам удовольствие.

Углубленные и начальные курсы по анализу данных с помощью нейронных сетей также представлены в Академии Анализа Данных, пишите: academy@statsoft.ru.

Владимир Боровиков

CEO StatSoft
Новости, истории и события
Смотреть все
Компания «Софтлайн Решения» (ГК Softline) получила награду за самый быстрый рост продаж от ГК «Солар»
Новости

Компания «Софтлайн Решения» (ГК Softline) получила награду за самый быстрый рост продаж от ГК «Солар»

23.10.2025

Производственную площадку компании VPG LaserONE (кластер «СФ Тех» ГК Softline) посетил Первый заместитель Председателя Правительства РФ Денис Мантуров
Новости

Производственную площадку компании VPG LaserONE (кластер «СФ Тех» ГК Softline) посетил Первый заместитель Председателя Правительства РФ Денис Мантуров

23.10.2025

ADV-T стал официальным партнером ИТ-вендора «Инферит» (кластер «СФ Тех» ГК Softline)
Новости

ADV-T стал официальным партнером ИТ-вендора «Инферит» (кластер «СФ Тех» ГК Softline)

23.10.2025

Образовательная платформа «Кибертори» от Академии АйТи FabricaONE.AI (акционер — ГК Softline) стала лауреатом премии «Хрустальная пирамида 2025»
Новости

Образовательная платформа «Кибертори» от Академии АйТи FabricaONE.AI (акционер — ГК Softline) стала лауреатом премии «Хрустальная пирамида 2025»

22.10.2025

«Софтлайн Решения» обеспечивает цифровую трансформацию закупок ритейлера на low-code платформе
Новости

«Софтлайн Решения» обеспечивает цифровую трансформацию закупок ритейлера на low-code платформе

22.10.2025

Bell Integrator FabricaONE.AI (акционер – ГК Softline) разработала единый ID сервис для идентификации, аутентификации и авторизации клиентов
Новости

Bell Integrator FabricaONE.AI (акционер – ГК Softline) разработала единый ID сервис для идентификации, аутентификации и авторизации клиентов

22.10.2025

«Инферит ОС» (кластер «СФ Тех» ГК Softline) подтверждает совместимость ОС «МСВСфера» и службы каталогов Avanpost DS
Новости

«Инферит ОС» (кластер «СФ Тех» ГК Softline) подтверждает совместимость ОС «МСВСфера» и службы каталогов Avanpost DS

21.10.2025

«Софтлайн Решения» (ГК Softline) внедрила систему управления проектами EvaProject от EvaTeam
Новости

«Софтлайн Решения» (ГК Softline) внедрила систему управления проектами EvaProject от EvaTeam

21.10.2025

Сомерс (ГК Softline) запускает OpenTips — решение для приема чаевых «в один шаг»
Новости

Сомерс (ГК Softline) запускает OpenTips — решение для приема чаевых «в один шаг»

21.10.2025

Проект автоматизации в органах власти Петербурга, реализованный на платформе ROBIN от компании SL Soft FabricaONE.AI (акционер – ГК Softline), победил в конкурсе «ПРОФ-IT»
Новости

Проект автоматизации в органах власти Петербурга, реализованный на платформе ROBIN от компании SL Soft FabricaONE.AI (акционер – ГК Softline), победил в конкурсе «ПРОФ-IT»

20.10.2025

«Инферит ИТМен» (кластер «СФ Тех» ГК Softline) помог страховому брокеру Remind взять под контроль ИТ-инфраструктуру
Новости

«Инферит ИТМен» (кластер «СФ Тех» ГК Softline) помог страховому брокеру Remind взять под контроль ИТ-инфраструктуру

20.10.2025

ПАО «Софтлайн» объявляет о результатах реализации третьего этапа обмена ГДР Noventiq на акции ПАО «Софтлайн»
Новости

ПАО «Софтлайн» объявляет о результатах реализации третьего этапа обмена ГДР Noventiq на акции ПАО «Софтлайн»

20.10.2025

«Софтлайн Решения» помогла производителю химической продукции повысить эффективность проектной деятельности
Новости

«Софтлайн Решения» помогла производителю химической продукции повысить эффективность проектной деятельности

17.10.2025

SL Soft FabricaONE.AI (акционер — ГК Softline) и «Техностанция» автоматизировали управление маркетплейсами с помощью платформы ROBIN
Новости

SL Soft FabricaONE.AI (акционер — ГК Softline) и «Техностанция» автоматизировали управление маркетплейсами с помощью платформы ROBIN

17.10.2025

ГК Softline и «Тангл» объявляют о стратегическом партнерстве
Новости

ГК Softline и «Тангл» объявляют о стратегическом партнерстве

16.10.2025

«Софтлайн Решения» предоставила вычислительный кластер «под ключ» в аренду российской компании
Новости

«Софтлайн Решения» предоставила вычислительный кластер «под ключ» в аренду российской компании

16.10.2025

Александр Минин назначен генеральным директором компании «Софтлайн Решения»
Новости

Александр Минин назначен генеральным директором компании «Софтлайн Решения»

15.10.2025

SL Soft FabricaONE.AI (акционер — ГК Softline) представила SL AI Search — корпоративный интеллектуальный поиск нового поколения
Новости

SL Soft FabricaONE.AI (акционер — ГК Softline) представила SL AI Search — корпоративный интеллектуальный поиск нового поколения

15.10.2025

Smart TV: российские операционные системы и будущее рынка
Блог

Smart TV: российские операционные системы и будущее рынка

23.10.2025

Новая эра мобильных технологий: российско-корейский ответ крупным западным игрокам
Блог

Новая эра мобильных технологий: российско-корейский ответ крупным западным игрокам

20.10.2025

Облачные технологии: что это такое, виды сервисов, модели развертывания и тренды 2025
Блог

Облачные технологии: что это такое, виды сервисов, модели развертывания и тренды 2025

14.10.2025

Оснащение кабинетов физики: от макетов и датчиков до цифровых лабораторий
Блог

Оснащение кабинетов физики: от макетов и датчиков до цифровых лабораторий

10.10.2025

Обзор нейросетей для работы с текстом
Блог

Обзор нейросетей для работы с текстом

10.10.2025

Использование дронов и БПЛА в школах и образовательных учреждениях
Блог

Использование дронов и БПЛА в школах и образовательных учреждениях

03.10.2025

ИБ-консалтинг для финансовых организаций: защита активов, клиентов и репутации
Блог

ИБ-консалтинг для финансовых организаций: защита активов, клиентов и репутации

30.09.2025

Топ игровых бюджетных и премиальных игровых ноутбуков 2025
Блог

Топ игровых бюджетных и премиальных игровых ноутбуков 2025

19.09.2025

Голосовые помощники и боты для бизнеса
Блог

Голосовые помощники и боты для бизнеса

18.09.2025

Аренда серверного оборудования vs собственная инфраструктура: сравниваем экономику
Блог

Аренда серверного оборудования vs собственная инфраструктура: сравниваем экономику

12.09.2025

Топ лучших ноутбуков 2025 года для дома и офиса
Блог

Топ лучших ноутбуков 2025 года для дома и офиса

09.09.2025

Резервное копирование: ключевые параметры бэкапа и топ российских систем
Блог

Резервное копирование: ключевые параметры бэкапа и топ российских систем

03.09.2025

Современные лазерные технологии в промышленности: анализ рынка и инновационных решений в 2025 году
Блог

Современные лазерные технологии в промышленности: анализ рынка и инновационных решений в 2025 году

25.08.2025

Российские операционные системы. Топ отечественных ОС 2025
Блог

Российские операционные системы. Топ отечественных ОС 2025

21.08.2025

Цифровые лаборатории, VR-анатомия и не только: современные медико-биологические классы
Блог

Цифровые лаборатории, VR-анатомия и не только: современные медико-биологические классы

13.08.2025

Практическое руководство по защите коммерческой тайны в России: пошаговые инструкции и правовые аспекты
Блог

Практическое руководство по защите коммерческой тайны в России: пошаговые инструкции и правовые аспекты

05.08.2025

Импортозамещение в 2025 году
Блог

Импортозамещение в 2025 году

01.08.2025

Искусственный интеллект для медицины: реалии 2025 года
Блог

Искусственный интеллект для медицины: реалии 2025 года

24.07.2025