Глобалният прекъсване на AWS причинява масивни прекъсвания на уебсайтове, приложения и плащания

  • Неуспех в US-EAST-1 (Северна Вирджиния) причинява грешки и забавяне в множество AWS услуги.
  • Инцидентите са засечени между 08:40 и 09:00 (полуостровно време) и са потвърдени от Amazon малко след това.
  • Засегнати ключови платформи: Alexa, Prime Video, Fortnite, Roblox, Canva, Duolingo, Reddit и други.
  • AWS обсъжда признаци на възстановяване и препоръчва повторен опит за операции; смекчаване на проблем с DNS, свързан с DynamoDB.

Прекъсване на облачните услуги на AWS

Широко прекъсване в Amazon Web Services (AWS) Тази сутрин вирусът причини мащабни сривове в десетки приложения, уебсайтове и дигитални услуги по целия свят. Регистрирани са първите предупреждения. от 08:40 до 09:00 (полуостровно време), с особено въздействие върху услугите, зависими от региона US-EAST-1.

Спадът не се ограничава само до един продукт: той варира от гласови асистенти и стрийминг до инструменти за продуктивност, социални мрежи и видеоигри. В Испания също са съобщени инциденти в... плащания с карта и Bizum, заедно с проблеми с телефоните за данни и някои банкомати, което е довело до временно прибягване до пари в брой.

Какво се случва в момента

Amazon е разпознал в своя панел за състояние a аномално увеличение на грешките и латентностите в различни услуги, предлагани в региона US-EAST-1 (Северна Вирджиния)Компанията уверява, че техническите ѝ екипи работят за възстановяване на нормалността и че с течение на часовете, наблюдават се значителни признаци на възстановяване в повечето от заявките.

През цялата сутрин имаше няколко актуализации: първо инцидентът беше потвърден (минути след 09:00), след което беше съобщено, че Повечето операции би трябвало да започнат да се обработват успешно, а по-късно беше посочено, че произходът на проблемите е свързан с DNS разрешаването, свързано с DynamoDBСмекчаването на този момент подобри ситуацията, въпреки че все още може да се появят остатъчни грешки.

За тези, които продължават да срещат грешки при свързване с определени услуги, AWS препоръчва заявки за повторен опит и в специфични случаи, изчистване на DNS кеша, особено ако проблемите с крайните точки на DynamoDB в засегнатия регион продължават.

Доклади от платформи за проследяване на инциденти показват, че траен спад в отчетите с напредването на обяд, което показва постепенно и поетапно възстановяване в зависимост от услугата и местоположението.

Услуги, засегнати от прекъсването на AWS

Услуги и платформи с инциденти

Обхватът на засегнатите услуги е широк и разнороден. Сред най-често споменаваните от потребителите и компаниите са Alexa и Prime Video. Екосистема на Амазонка, както и множество приложения на трети страни, които разчитат на инфраструктурата на AWS.

  • забавления и игриFortnite, Roblox, Clash Royale, PUBG, Rainbow Six Siege, Crunchyroll и Прайм видео са съобщили за грешки във връзката и периодични прекъсвания.
  • Производителност и творчествоCanva, Duolingo, Trello, Slack, Zoom и Dropbox са показали нестабилен достъп и високи времена за реакция.
  • Мрежи и съобщенияReddit и Snapchat натрупаха доклади за грешки при зареждане и временни блокажи.
  • Изкуствен интелект и асистентиУстройства, поддържащи Perplexity и Alexa, и Amazon Generative AI, както и камери и звънци на врати на екосистемата Ring, са имали прекъсвания във функциите.
  • Плащания и търговияинциденти в телефони за данни, Бизум и някои портали са довели до налагане на спиране на специфични операции; Ticketmaster Това дори забави продажбата на билети, като например планираните за „Ореха на Ван Гог“.

Глобален обхват на инцидента в AWS

Къде е най-забележимо и защо засяга хора извън САЩ.

Инцидентите са концентрирани на източното крайбрежие на Съединените щати (с пикове през Ню Йорк, Лос Анджелис, Сан Франциско и Сиатъл), но проблеми са съобщени и в Обединеното кралство (Лондон и Манчестър) и няколко европейски страни. Въпреки че епицентърът е в US-EAST-1, много глобални услуги зависят от този регион за критични части от дейността си.

На практика това означава, че някои приложения Те остават достъпни, но с ограничени функцииили не актуализират съдържанието в реално време. Тази разпределена архитектура обяснява защо локализирана повреда може имат ефект на доминото върху други региони, дори когато европейските или азиатските центрове за данни продължават да функционират.

Ориентировъчна хронология на инцидента

• Сред 08:40 и 09:00 (полуостровно време) възникват първите пикове на докладите. • Относно 09:30, AWS потвърждава проблеми, които увеличаване на процента на грешки и латентностите в различни услуги. • Около 11:00, Amazon посочва, че е идентифицирала възможната причина и работи по смекчаване на проблема. • След 11:30, комуникира ясни признаци на възстановяване• По обяд докладите намаляват и повечето услуги се възстановяват постепенно.

Въпреки това, компанията предупреждава за евентуални остатъчни инциденти при определени операции и препоръчва повторни опити, докато се възстанови нормалността на всички фронтове.

Как ви засяга и какво можете да направите

Ако забележите, че даден уебсайт не се зарежда, Алекса не отговаряАко онлайн игра не се свързва или служебно приложение има проблеми, вероятно услугата зависи от AWS и е във фаза на възстановяване. В тези случаи, Рестартирането на рутери или устройства обикновено не помага.Най-ефективното нещо е да изчакате и да опитате отново по-късно.

В професионална среда е препоръчително критичните задачи да се планират с резерв и, ако е възможно, активиране на повторни опити и изчаквания по-щедри при интеграции, които зависят от крайни точки на AWS. В много специфични сценарии, изпразването на DNS кеш може да ускори повторното свързване към определени услуги, които вече са били възстановени.

Напомняне за зависимостта от облака

С пазарен дял надвишаващ 30% В световен мащаб AWS е гръбнакът на хиляди дигитални бизнеси. Когато инцидент засегне ключов регион като US-EAST-1, ударната вълна Това е очевидно в приложенията, използвани ежедневно от милиони хора, от стрийминг и игри до банкиране и електронна търговия.

Днешният епизод отново повдига въпроса за необходимостта от устойчиви архитектури (многорегионални, многослойни и с контролирана деградация), в допълнение към ясни комуникационни стратегии за управление на очакванията на потребителите и клиентите когато възникнат големи прекъсвания.

След няколко часа работа по смекчаване на последиците от страна на Amazon, ситуацията сочи към... постепенно възстановяване в повечето услуги, с видими подобрения в достъпа и латентността. Все още може да има малки сътресения, но тенденцията е положителна и всичко показва, че трафикът се връща към нормалното в някои участъци, тъй като корекциите в засегнатия регион са завършени.

Amazon генеративни AI работници
Свързана статия:
Amazon Generative AI: Как да създадете оригинално съдържание с AI