Почему современный Интернет так уязвим.

Почему современный Интернет так уязвим.

Для большей части мира понятие «быть офлайн» больше не существует. Интернет лежит в основе глобальной финансовой и потребительской экосистемы, обеспечивая мгновенную коммуникацию и транзакции. Хотя эта система является неотъемлемой частью многих видов человеческой деятельности, она также уязвима, стоит миллиарды долларов и создает огромные неудобства, когда часть ее перестает работать.

В 2025 году регулярно происходят масштабные отключения; технические сбои у крупных поставщиков веб-инфраструктуры привели к отключению сервисов для миллионов пользователей.

Одно 15-часовое отключение в дата-центрах Amazon.com Inc. в октябре лишило британских детей доступа к игровой платформе Roblox, помешало работникам совершать звонки через Zoom и вынудило дежурных инженеров в Индии отменить планы на религиозный праздник Дивали. В середине ноября сбой в работе компании Cloudflare Inc., занимающейся веб-безопасностью, привел к отключению целого ряда сайтов, включая ChatGPT, транспортную администрацию Нью-Джерси и социальную сеть X.

Центр обработки данных AWS в Эшберне, Вирджиния, США.
Центр обработки данных AWS в Эшберне, Вирджиния, США.

Может показаться странным, что проблема у одного провайдера может вызвать такую цепь проблем. Причина кроется в том, как развивался Интернет с момента его появления, а также в сокращении затрат и повышении эффективности, к которым прибегают компании, услугами которых пользуются миллионы потребителей.

Как пользователи получают доступ к Интернету?

Когда пользователь в Великобритании вводит google.com в свой телефон или компьютер, запускается сложный, но молниеносный цикл процессов. Всем устройствам — телефонам, ПК, серверам — подключенным к Интернету, присваиваются идентификаторы, называемые IP-адресами, и они используют систему доменных имен (DNS) для поиска и связи друг с другом. Между тем, сайты и приложения, такие как Google, состоят из пакетов данных, включающих текст, изображения и функциональные возможности.

Чтобы загрузить Google, устройство пользователя отправляет запрос на эти пакеты данных через WiFi, мобильные данные или проводное соединение. Запрос проходит по физической инфраструктуре, такой как маршрутизаторы, кабели, коммутаторы, региональные центры обработки данных и, возможно, через подводные кабели, пока не достигает нужного сервера Google. Этот сервер, который находится в центре обработки данных вместе с сотнями тысяч других серверов Google, проверяет запрос и направляет соответствующие пакеты данных обратно пользователю через те же глобальные инфраструктурные сети.

Сбои могут происходить, когда что-либо в этой взаимосвязанной цепочке выходит из строя. И большая часть причин, по которым сейчас происходят сбои в больших масштабах, связана с ростом популярности облачных вычислений.

Приложения, такие как Google, состоят из пакетов данных, включающих текст, изображения и функциональные возможности.
Приложения, такие как Google, состоят из пакетов данных, включающих текст, изображения и функциональные возможности.
Почему сейчас сбои в работе вызывают такое беспокойство?

Основное изменение в работе Интернета заключается в том, где хранятся данные и инфраструктура. В 1990-х и начале 2000-х годов любая компания, имевшая собственный веб-сайт, вероятно, располагала собственными серверами в своих офисах или штаб-квартирах — так называемыми локальными серверами. В качестве альтернативы она арендовала серверы у другой компании, но по-прежнему управляла аппаратным и программным обеспечением. На уровне отдельного пользователя все, что касалось компьютера, также включало хранение информации локально: музыка, фотографии, файлы — все хранилось на жестких дисках. Любой сбой мог быть связан с одним поврежденным файлом, и хотя потеря тысяч цифровых фотографий была бы неприятной, она не повлияла бы на других пользователей.

Облачные вычисления стали массовыми после того, как Amazon, известный в основном как гигант онлайн-ритейла, понял, что его инженеры тратят чрезмерно много времени на решение одних и тех же проблем, связанных с вычислительной инфраструктурой и хранением данных. Компания построила общую инфраструктуру, чтобы облегчить эту нагрузку, а затем поняла, что эту концепцию можно применить к большей части Интернета.

Идея прижилась, и теперь большинство интернет-пользователей и предприятий в той или иной степени полагаются на облачные вычисления. После Amazon Web Services свои собственные сервисы запустили Microsoft Corp. и Google, принадлежащий Alphabet Inc., и эти три технологические компании стали доминировать в сфере облачных вычислений во всем мире.

На практике это означает эксплуатацию миллионов серверов в дата-центрах. Как правило, они объединены в «регионы» — отдельные кластеры серверных ферм, обслуживающие конкретную страну или область. Некоторые регионы могут обрабатывать больше трафика, что означает непропорционально большое влияние в случае выхода одного из них из строя. Некоторые компании могут иметь региональные зависимости, о которых они не знают, что приводит к сбоям в работе сервисов из-за отключения за пределами их региона.

Отключение AWS в октябре было вызвано ошибкой, повлиявшей на один из его ключевых сервисов, что привело к каскадным сбоям и выводу из строя нескольких крупных сайтов и сервисов.

Поскольку Интернет — это не только пакеты данных, но и большая физическая инфраструктура, эти инциденты могут быть вызваны целым рядом причин, таких как ошибка программного обеспечения, перегрев центра обработки данных или изношенный кабель. Удивительно, что сбои не происходят чаще.

Почему облачные сервисы, такие как AWS, Microsoft Azure и Google Cloud, занимают доминирующее положение?

Например, в Великобритании облачные сервисы AWS и Microsoft Azure занимают более 70 % рынка облачных вычислений. Это результат преимущества первопроходца, существующего положения Microsoft в сфере корпоративных технологий и огромных финансовых возможностей.

Однако зависимость от нескольких доминирующих поставщиков облачных услуг имеет ряд побочных эффектов. Сбой в работе может теперь вывести из строя целые сегменты Интернета.

Amazon Web Services, Microsoft и Google доминируют в сфере облачных вычислений во всем мире.
Amazon Web Services, Microsoft и Google доминируют в сфере облачных вычислений во всем мире.

Гипермасштабируемые компании, как их стали называть, также подвергаются критике за бизнес-практики, которые затрудняют выход на рынок новых участников и переход предприятий на других поставщиков облачных вычислений. Поскольку технологическая инфраструктура, необходимая для каждого облачного сервиса, различна, смена поставщика может обойтись предприятиям очень дорого. Инженеры-облачные специалисты также часто проходят сертификацию для одного конкретного поставщика, что увеличивает стоимость и сложность диверсификации.

Что может пойти не так с крупными облачными сервисами?

Одной из причин популярности крупных поставщиков облачных услуг является их надежность. Облачные вычисления — это быстрорастущий сегмент их бизнеса, и в их интересах обеспечить бесперебойную работу сервисов.

Тем не менее, это не может объяснить все более взаимосвязанный характер технологических услуг, особенно когда несколько компаний доминируют на разных уровнях инфраструктуры.

Например, CrowdStrike Holdings Inc. не является крупной технологической компанией, но занимает доминирующее положение в сфере кибербезопасности. Его популярность означает, что он работает на миллионах систем Microsoft Windows, часто выполняющих критически важные операции в крупных организациях. Когда в июле 2024 года компания выпустила неисправное обновление программного обеспечения через облачное обновление, это мгновенно привело к появлению «синего экрана смерти» на миллионах компьютеров. Хотя это не было проблемой облака, одновременный характер облачных обновлений вывел из строя миллионы машин сразу.

Пустые цифровые рекламные щиты на Таймс-сквер в Нью-Йорке после неудачного обновления программного обеспечения CrowdStrike.
Пустые цифровые рекламные щиты на Таймс-сквер в Нью-Йорке после неудачного обновления программного обеспечения CrowdStrike.
Что могут сделать компании, чтобы защитить себя от риска сбоев?

Самое важное, что могут сделать компании, — это заранее продумать, что они будут делать в случае сбоя, прежде чем он действительно произойдет. Это может означать дополнительные расходы на обеспечение резервного обслуживания на случай выхода из строя основного региона или адаптацию инфраструктуры с целью создания «внутренних» резервных серверов для наиболее важных служб.

Что касается остальных, то во время крупного сбоя системы вы не можете сделать ничего, кроме как ждать, пока поставщик облачных услуг устранит проблему

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *