Amazon сообщил, что облачный сервис AWS вернулся к нормальной работе после сбоя, нарушившего работу компаний по всему миру.

Amazon сообщает, что облачный сервис AWS вернулся к нормальной работе.

Amazon Web Services, принадлежащий Amazon.com, вернулся к нормальной работе днем 20 октября, сообщила компания, после сбоя в работе Интернета, который вызвал глобальный сбой тысяч сайтов, включая некоторые из самых популярных веб-приложений, таких как Snapchat и Reddit.

Тем не менее, Amazon заявил, что в некоторых сервисах AWS накопилось много сообщений, обработка которых займет несколько часов.

На AWS размещаются приложения и компьютерные процессы для компаний по всему миру, и из-за сбоев сотрудники от Лондона до Токио были отключены от сети, а другие не могли выполнять обычные повседневные задачи, такие как оплата услуг парикмахеров или замена авиабилетов. 20 октября днем пользователи жаловались на сохраняющиеся трудности с использованием таких сервисов, как цифровой кошелек Venmo и сайт видеозвонков Zoom.

Это был крупнейший сбой интернета с прошлого года, когда сбой CrowdStrike парализовал работу технологических систем в больницах, банках и аэропортах, продемонстрировав уязвимость взаимосвязанных технологий во всём мире.

Это как минимум третий случай за пять лет, когда кластер AWS в северной Вирджинии, известный как US-EAST-1, стал причиной серьёзного интернет-коллапса.

Amazon не ответил на запрос о разъяснениях относительно причин, по которым этот центр обработки данных продолжает страдать. Проблемы были связаны с так называемой системой доменных имён (DNS), которая не позволяла приложениям находить правильный адрес для API DynamoDB от AWS — облачной базы данных, используемой для хранения пользовательской информации и других критически важных данных.

ОСНОВНАЯ ПРИЧИНА — МОНИТОРИНГ РАБОТОСПОСОБНОСТИ СЕТИ.

Ранее AWS заявил, что основной причиной сбоя стала базовая подсистема, которая отслеживает работоспособность своих сетевых балансировщиков нагрузки, используемых для распределения трафика между несколькими серверами.

По данным AWS, проблема возникла во «внутренней сети EC2» — сервисе Amazon «Elastic Compute Cloud», который предоставляет облачные ресурсы по требованию в AWS.

Вскоре после 15:00 По тихоокеанскому времени (22:00 по Гринвичу) Amazon сообщил: «Все сервисы AWS вернулись к нормальной работе. У некоторых сервисов, таких как AWS Config, Redshift и Connect, по-прежнему накопилось много сообщений, обработка которых завершится в течение следующих нескольких часов».

Кен Бирман, профессор компьютерных наук Корнеллского университета, заявил, что разработчикам программного обеспечения необходимо повысить отказоустойчивость. Он отметил, что AWS предоставляет разработчикам инструменты, которые они могут использовать для защиты в случае возникновения проблем в любом из своих разветвленных центров обработки данных, а также возможность создавать резервные копии у других поставщиков облачных услуг.

«Когда люди сокращают расходы и стараются использовать все возможности, чтобы запустить приложение, а потом забывают, что пропустили этот последний шаг и не обеспечили надёжной защиты от сбоев, именно такие компании впоследствии заслуживают пристального внимания», — сказал Бирман агентству Reuters.

ПРОБЛЕМА ВОЗНИКЛА НА ОБЪЕКТЕ AWS, ИЗВЕСТНОГО СВОИМИ ПРЕДЫДУЩИМИ СБОЯМИ В РАБОТЕ.

AWS предоставляет вычислительные мощности, хранилища данных и другие цифровые сервисы компаниям, государственным органам и частным лицам и является крупнейшим в мире поставщиком облачных услуг, за которым следуют Azure от Microsoft и Google Cloud от Alphabet.

Сбои в работе серверов могут привести к сбоям в работе различных веб-сайтов и платформ — от приложений доставки еды до игровых платформ и систем авиакомпаний, — которые используют облачную инфраструктуру AWS.

На своей странице статуса AWS сообщил, что сбой произошел 20 октября на узле US-EAST-1, старейшем и крупнейшем в мире для веб-сервисов. Сбои на этом узле происходили в 2021 и 2020 годах.

Согласно документации на сайте AWS, узле US-EAST-1 часто используется по умолчанию для многих сервисов AWS.

«УЯЗВИМЫЕ ИНФРАСТРУКТУРЫ».

Эта проблема подчеркивает, насколько взаимосвязанными стали повседневные цифровые сервисы и насколько они зависят от небольшого числа глобальных облачных провайдеров. Один сбой может нанести ущерб бизнесу и повседневной жизни, заявили эксперты и учёные.

«Этот сбой в очередной раз подчёркивает нашу зависимость от относительно уязвимых инфраструктур», — заявил Джейк Мур, консультант по глобальной кибербезопасности европейской компании ESET.

В Великобритании, согласно британскому сайту Downdetector, пострадали Lloyd Bank, Bank of Scotland, а также операторы связи Vodafone и BT, как и сайт налоговой, платёжной и таможенной службы Великобритании HMRC.

«Основная причина этой проблемы заключается в том, что все эти крупные компании полагались только на один сервис», — отметил Нишант Шастри, директор по исследованиям кафедры компьютерных наук Университета Суррея.

Компания Ookla, которой принадлежит Downdetector, сообщила, что более 4 миллионов пользователей сообщили о проблемах, вызванных инцидентом.

«Для крупных компаний часы простоя в облаке означают миллионы долларов потерь производительности и доходов», — заявил Райан Гриффин, руководитель отдела кибербезопасности в США страховой брокерской компании McGill and Partners.

Уолл-стрит в целом остался равнодушным, в результате чего акции Amazon выросли на 1,6% до 216,48 доллара.

ОТ SNAPCHAT ДО VENMO: СБОЙ ВЫВЕЛ ИЗ СТРОЯ ПРИЛОЖЕНИЯ.

Компания Ookla сообщила, что сбой затронул как минимум тысячу компаний.

Пострадали такие приложения, как Reddit, Roblox, Snapchat и Duolingo.

Стартап в области искусственного интеллекта Perplexity, криптовалютная биржа Coinbase и торговое приложение Robinhood — все они столкнулись со сбоями в работе платформ и связали их с AWS.

Собственные сервисы Amazon, включая веб-сайт для покупок Prime Video и Alexa, также пострадали.

Среди игровых платформ, которые пострадали, были Fortnite, принадлежащая Epic Games, Clash Royale и Clash of Clans. Конкурент Uber — Lyft — также пострадал в Соединенных Штатах.

3 комментария на ««Amazon сообщил, что облачный сервис AWS вернулся к нормальной работе после сбоя, нарушившего работу компаний по всему миру.»»

  1. […] роста на 19%. AWS всё ещё не оправился от, примерно, 15-часового отключения интернета на прошлой неделе, которое привело к краху многих самых популярных […]

  2. […] возникла менее чем через месяц после того, как Amazon Web Services пережил дневной сбой, который привел к отключению множества […]

  3. […] Одно 15-часовое отключение в дата-центрах Amazon.com Inc. в окт… лишило британских детей доступа к игровой платформе Roblox, помешало работникам совершать звонки через Zoom и вынудило дежурных инженеров в Индии отменить планы на религиозный праздник Дивали. В середине ноября сбой в работе компании Cloudflare Inc., занимающейся веб-безопасностью, привел к отключению целого ряда сайтов, включая ChatGPT, транспортную администрацию Нью-Джерси и социальную сеть X. […]

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *