Крупнейшие сбои 2021 — ТОП-10 по версии ThousandEyes

adminComments off.

Компания ThousandEyes (часть #Cisco) рассказала о самых масштабных сбоях в работе крупных компаний, которые затронули большое количество предприятий и конечных пользователей:
1. Facebook: 4 октября. Это был самый большой сбой 2021 года. Сервис «упал» на период около 7 часов. Отключение затронуло все сервисы Facebook, включая Instagram, WhatsApp и Oculus, а также все компании, которые использовали механизм аутентификации Facebook. Причиной стал сбой в техническом обслуживании: случайно была дана команда, которая отключила все ЦОДы Facebook. В результате отказали не только общедоступные сервисы, но и инструменты, которые сотрудники использовали для управления этими сервисами. Для устранения проблем персоналу приходилось физически входить в ЦОДы, чтобы перезапускать системы вручную.

2. AWS: 7 декабря. AWS — крупнейший в мире поставщик услуг облачных вычислений, и когда его сервисы перестали работать, могли пострадать миллионы компаний. Сбой, который длился более часа, затронул собственные сервисы Amazon, а также потребительские устройства и потоковые сервисы, такие как Disney+ и Netflix. Причиной стали проблемы с API-интерфейсами AWS EC2 в регионе US-EAST-1.

3. Fastly: 8 июня. Fastly — одна из самых маленьких сетей доставки контента. По данным Enlyft, доля рынка компании составляет 4% по сравнению с 39% у CloudFlare и 24% у Amazon CloudFront. Тем не менее, услугами бренда пользуются более 100 тыс. компаний, включая Reddit и New York Times. Даже Amazon и eBay пользуются некоторыми услугами Fastly и пострадали от их июньского сбоя.

4. Akamai Edge DNS: 22 июля. Akamai — это глобальная сеть доставки контента, похожая на Fastly по количеству пользователей и доле рынка. И, как и в случае с Fastly, компании, которые использовали несколько CDN, столкнулись с меньшими последствиями сбоя. В случае этого конкретного сбоя служба DNS Akamai не работала более часа. По словам компании, обновление конфигурации ПО вызвало ошибку в их сети доставки контента Secure Edge. Пострадали многие крупные веб-сайты, в том числе Steam, American Airlines, Fox News и HSBC. Amazon, который использует несколько CDN, смог перенаправить трафик и избавить пользователей от каких-либо последствий.

5. Akamai Prolexic Routed: 16 июня. Июльский сбой был не единственным крупным сбоем для Akamai в прошлом году. В июне компания столкнулась со сбоем в работе службы защиты от DDOS Prolexic Routed из-за проблемы с маршрутизацией BGP. По данным ThousandEyes, некоторые веб-сайты клиентов были недоступны в течение разного времени. Но, быстро приняв меры, компания свела к минимуму воздействие на своих клиентов.

6. Verizon: 26 января. Отключение Verizon стало первым крупным сбоем в 2021 году и затронуло пользователей от Вашингтона до Бостона. Десятки тысяч клиентов остались без обслуживания из-за выхода из строя сети Verizon FIOS. По данным Verizon, сбой произошел из-за «проблемы с ПО», возникшей во время рутинных действий по управлению сетью.

7. Comcast: 9 ноября. Магистральная сеть Comcast в районе Сан-Франциско вышла из строя почти на два часа, затем последовал более масштабный сбой, который длился более часа в нескольких городах США, включая Чикаго и Филадельфия, простираясь до Нью-Джерси и Южной Каролины. Пострадали десятки тысяч домашних и бизнес-пользователей сети Comcast Xfinity. Наиболее вероятной причиной стали проблемы с внутренней маршрутизацией.

8. Cloudflare Magic Transit: 3 мая. Сервис Magic Transit от Cloudflare предназначен для защиты клиентов от DDOS-атак. Этот конкретный сбой затронул инфраструктуру Cloudflare по всему миру, и проблемы разного уровня возникали в течение примерно двух часов.

9. Azure AD: 15 декабря. Самым последним из крупных сбоев в 2021 году был декабрьский сбой Active Directory. Служба Azure AD отключилась на полтора часа, что не позволило пользователям войти в такие службы Microsoft, как Office 365.

10. Facebook: 8 апреля. Завершает список снова Facebook с апрельским отключением, которое длилось около 40 минут. Причиной этого сбоя стала ситуация, когда слишком много пользователей были направлено только в один ЦОД, что привело к перегрузке сети.

Ключевым выводом из всех этих простоев является то, что компаниям необходимо знать обо всех компонентах и зависимостях, которые необходимы для обеспечения работы их систем, как на внутренней стороне, поддерживающей их серверы приложений, так и на внешней стороне, доставляющей данные конечным пользователям.

, , ,
Posted in: Блог
© 2010-2022 Winncom Technologies. Все права защищены.
Winncom Technologies © 2022

ОСТАВЬТЕ ЗАЯВКУ И ВАМ ПЕРЕЗВОНЯТ

*поля обязательны для заполнения.

ОСТАВЬТЕ ЗАЯВКУ И ВАМ ПЕРЕЗВОНЯТ

*поля обязательны для заполнения.

ПОДПИШИТЕСЬ НА НАШУ РАССЫЛКУ

  • Безопасность
  • Построение сети
  • ЦОД
  • Беспроводные решения
  • Видеоконференцсвязь
  • Оборудование
  • Сервисное обслуживание
  • Управление проектами под ключ
  • Все

*поля обязательны для заполнения.