Падение Facebook | Причины массового сбоя
- Причины падения Facebook
- Почему так долго не могли восстановить работу Facebook
- Последствия массового сбоя Facebook
- Как бизнесу минимизировать риски?
6 октября 2021 года издание The Wall Street Journal опубликовало информацию о том, что руководство Facebook планирует приостановить внедрение запланированных ранее обновлений и проектов. За два дня до этого, 4 октября, произошел самый серьезный с 2008 года сбой социальной сети. В этот же день бывшая сотрудница Facebook выступила в Конгрессе США с обвинением социальной сети в пренебрежении безопасностью пользователей ради прибыли. Эти события вызывают глобальные вопросы как к деятельности компании в целом, так и к ее внутренним инфраструктурным процессам. Редакция SLDDigital.com предложила экспертам по информационной безопасности проанализировать вероятные причины массового сбоя.
Почему произошел сбой?
Источником сбоя стало изменение в настройках BGP (Boarder Gateway Protocol) на магистральных маршрутизаторах, управляющих трафиком между ЦОД, которое привело к каскадному нарушению связности ЦОД Facebook с остальной глобальной сетьюDNS. Сбой также отразился на системе обмена информацией между собственными регистраторами DNS Facebook Facebook и связанные с ним сервисы WhatsApp и Instagram фактически перестали работать, как будто кто-то разом отключил ЦОД от сети.
Произошел отказ DNS-серверов: представьте, что в вашем телефоне есть телефонная книга, в ней указаны имя и фамилия контакта, но не указан сам номер телефона. При попытке вызвать абонента система просто не понимает, куда ей обращаться», -
Александр Дворянский, директор по коммуникациям компании InfoSecurity
Изменение конфигурации BGP-роутеров, послужившее причиной сбоя, подробно описано в блоге Cloudflare – глобального провайдера, предоставляющего услуги CDN, защиту от DDoS-атак, безопасный доступ к ресурсам и серверам DNS, а также сервисы для оптимизации работы приложений.

Почему сотрудники Facebook так долго не могли устранить последствия массового сбоя?
Сбой привел к нарушению работоспособности внутренних информационных систем и систем связи, из-за чего сотрудники, большая часть которых работала удаленно, не смогли подключиться к инфраструктуре и связаться с коллегами, что существенно усложнило работы по восстановлению. Ключевые сетевые инженеры также работали удаленно.
В первые часы «цифрового блэкаута» в сети появилось сообщение от репортера The New York Times о том, что сотрудники Facebook не могли войти в здания и оперативно оценить серьезность проблемы – их пропуска перестали работать на дверях и КПП. В итоге на устранение последствий массового сбоя ушло более шести часов.
Михаил Малышев, руководитель отдела развития решений ИБ Softline, считает, что на время ликвидации последствий повлияли скорее организационные нежели технические причины:
«Совпало несколько факторов, повлиявших на скорость устранения сбоя:
- Отсутствие компетентной дежурной службы внутри ЦОД, способной быстро решить проблему на месте.
- Отсутствие резервного канала связи с инфраструктурой ЦОД, по которому проблему можно было бы решить удаленно и при этом оперативно.
- Отключение системы доступа в ЦОД, авторизация которой была завязана на пропавшие в то время из сети домены Facebook».
Эффект разорвавшейся бомбы
После событий 4 октября руководство Facebook приняло решение приостановить релиз запланированных обновлений. Причиной осторожного поведения Facebook издание The Wall Street Journal называет расследование The Facebook Files, основанное, в том числе, на показаниях Фрэнсис Хауген, бывшей сотрудницы Facebook Inc.
«Руководство компании знает, как сделать Facebook и Instagram более безопасными, но не вносит необходимых изменений», – заявила Фрэнсис Хауген на слушании в Конгрессе США 5 октября 2021 года. Она открыто обвиняет Instagram в причинении вреда психологическому здоровью детей и подростков, а также говорит об использовании Facebook в целях работорговли и разжигания этнических конфликтов. Также публичному осуждению подвергся алгоритм работы Facebook, внедренный в 2018 году: социальная сеть «подкидывает дров» в дебаты пользователей под популярными постами, поднимая их в ленте публикаций. Посты рядовых пользователей уступили место блогерам и лидерам мнений, что сделало сеть более формальной и «злой». По ее словам, система рейтинга Facebook, основанная на вовлечении, не только способствует продвижению вредного и чрезмерно интересного контента, но и «буквально разжигает этническое насилие» в таких местах, как Эфиопия.
После нескольких публичных слушаний в Конгрессе законодатели заговорили об ужесточении регулирования технологических корпораций вообще и Facebook в частности. Они выдвинули ряд законодательных предложений, в том числе законопроекты, которые заставят такие компании, как Facebook, обеспечить большую прозрачность в отношении распространения дезинформации и другого вредоносного контента. «Это исследование – настоящий эффект разорвавшейся бомбы», – сказал сенатор Ричард Блюменталь, демократ штата Коннектикут, который руководил слушанием.
Как бизнесу минимизировать риски?
Опытный директор по ИТ сделает все возможное, чтобы минимизировать риски сбоев, подобных случившимся с Facebook, и вот приблизительный перечень мер, которые можно и должно принимать до катастрофы:
- Привлекать опытных инженеров и сетевых архитекторов.
- Не держать все системы в одном домене.
- Иметь резервные каналы связи, систему контроля доступа.
- Проводить учения по отработке действий в нештатных ситуациях.
«Непреднамеренное отключение систем из-за ошибок в настройках – случайность. Хуже, когда подобные истории происходят умышленно, как результат целевой атаки хакеров. В таких случаях ущерб может быть на порядок больше», - Михаил Малышев.
Теги:
Подпишитесь на нашу рассылку последних новостей и событий
Подписаться